Measurement_invariance
測定の不変性または測定の等価性は、測定の統計的特性であり、特定のグループ全体で同じ構造が測定されていることを示します。たとえば、測定不変性は、性別や文化的背景が異なる回答者によって、特定の測定値が概念的に類似した方法で解釈されるかどうかを調べるために使用できます。測定不変性に違反すると、測定データの意味のある解釈が妨げられる場合が測定不変性のテストは、古典的なテスト理論に根ざした測定品質の評価を補完するために、心理学などの分野でますます使用されています。
測定の不変性は、多くの場合、複数グループ確認因子分析(CFA) の枠組みでテストされます。 CFA を含む構造方程式モデルのコンテキストでは、測定不変性はしばしば階乗不変性と呼ばれます。
コンテンツ
1 意味
2 不変性の種類
3 不変性の検定
4 同等のレベル5 実装 6 批判
7 こちらもご覧ください
8 参考文献
意味
共通因子モデルでは、測定不変性は次の等式として定義できます。 へ ( よ ∣ η s) = へ( よ ∣ η)
{ f({textit {Y}}mid {boldsymbol {eta }},{textbf {s}})=f({textit {Y}}mid {boldsymbol {eta } })}
どこ へ ( ⋅ ) { f(cdot )}
は分布関数であり、 よ { {textit {Y}}}
は観測されたスコアであり、 η { {boldsymbol {eta }}}
は因子スコアで、sはグループ メンバーシップを示します (たとえば、白人 = 0、アフリカ系アメリカ人 = 1)。したがって、測定不変性は、被験者の因子スコアが与えられた場合、観察されたスコアがグループメンバーシップに依存しないことを伴います。
不変性の種類
連続アウトカムの共通因子モデルでは、いくつかの異なるタイプの測定不変性を区別できます。
1)等式: 因子の数と因子と指標の関係のパターンは、グループ間で同一です。
2)均等ローディング: 因子ローディングはグループ間で均等です。
3)等切片: 観察されたスコアが各因子で回帰されると、切片はグループ間で等しくなります。
4)等しい残差分散: 因子によって説明されていない観察されたスコアの残差分散は、グループ全体で等しくなります。
同じ類型は、個別の結果のケースに一般化できます。
1)等式: 因子の数と因子と指標の関係のパターンは、グループ間で同一です。
2)均等ローディング: 因子ローディングはグループ間で均等です。
3)等しいしきい値: 観察されたスコアが各因子で回帰される場合、しきい値はグループ間で等しくなります。
4)等しい残差分散: 因子によって説明されていない観察されたスコアの残差分散は、グループ全体で等しくなります。
これらの各条件は、特定の制約を持つ複数グループの確認因子モデルに対応しています。各モデルの耐久性は、尤度比検定またはその他の適合指標を使用して統計的に検定できます。グループ間の意味のある比較には、通常、厳密な測定不変性として知られる 4 つの条件がすべて満たされている必要がただし、厳密な測定不変性が適用されるコンテキストで保持されることはめったにありません。通常、これは、モデルの適合性がその間に低下しない場合、等式条件から開始して最終的に等残差条件に進む追加の制約を順次導入することによってテストされます。
不変性の検定
さまざまな不変性テストとそれぞれの基準を多様なテスト条件に適用するには、さらなる研究が必要ですが、応用研究者の間では 2 つのアプローチが一般的です。比較される各モデル (例: 等式、等切片)について、モデルの暗示平均および共分散行列と観測された平均および共分散行列の間の差の最小化から、χ 2適合統計量が反復的に推定されます。比較対象のモデルが入れ子になっている限り、さまざまなレベルの不変性を持つ任意の 2 つの CFA モデルのχ 2値とそれぞれの自由度の差はχ 2分布 (diff χ 2 ) に従い、したがって、ますます制限的なモデルがモデルとデータの適合性にかなりの変化をもたらすかどうかの指標として、重要性を調べることができます。しかし、diff χ 2は、不変性を対象とした制約 (例: サンプルサイズ) の変化とは関係のない要因に敏感であるという証拠がいくつかしたがって、測定の不変性を調査するために、指定された 2 つのモデルの比較適合指数(ΔCFI) の差も使用することをお勧めします。さまざまなレベルの測定不変性 (たとえば、等しいフォームと等しい荷重) の 2 つのモデルの CFI の差が -0.01 未満 (つまり、0.01 を超えて減少) の場合、不変性は維持できない可能性が差し引かれる CFI 値は、diff χ 2検定の場合のように、ネストされたモデルに由来すると予想されます。しかし、CFI テストを適用する際に、応用研究者がこれを考慮に入れることはめったにないようです。
同等のレベル
等価性は、測定等価性の 3 つの階層レベルに従って分類することもできます。
構成上の同等性: 因子構造は、複数グループの確認因子分析のグループ間で同じです。
メトリックの同等性: 因子負荷量はグループ間で類似しています。
スカラー等価性: 値/平均もグループ間で等価です。
実装
測定不変性のテストは、R プログラミング言語で利用できます。
批判
著名な政治学者クリスチャン・ウェルツェルと彼の同僚は、異文化統計における文化的および心理的構成要素の妥当性を判断する基準として、不変性テストに過度に依存していることを批判しています。彼らは、不変性基準がグループ間分散の低い構成要素を支持する一方で、グループ間分散の高い構成要素はこれらのテストに失敗することを実証しました。構成要素が異文化間の比較に役立つためには、グループ間の分散が高いことが確かに必要です。一部のグループ平均がクローズド エンド スケールの極端な端に近く、グループ内分散が必然的に低い場合、グループ間分散は最も高くなります。グループ内分散が低いと、相関が低く、因子負荷量が低くなり、学者はこれを一貫性のない指標として日常的に解釈します。Welzel と同僚は、代わりに、構成概念がグループ間の差異の他の尺度と予想される方法で相関するかどうかに基づいて、構成概念の妥当性のノモロジー基準に依存することを推奨しています。それらは、異文化間の比較において高い説明力と予測力を持ちながら、不変性のテストに失敗する文化的構成のいくつかの例を提供します。 不変性テストの支持者は、ノモロジカルなつながりへの依存は、そのような外部検証が比較可能性の仮定にかかっていることを無視していると反論している.
こちらもご覧ください
差分アイテム機能
参考文献
^ ヴァンデンバーグ、ロバート J.; ランス、チャールズ E. (2000)。「測定不変文献のレビューと統合:組織研究のための提案、実践、および推奨事項」。組織研究方法。3 : 4–70。ドイ: 10.1177/109442810031002 . S2CID 145605476 .
^ チェン、ファンファン; スーザ、カレン H.; ウェスト、スティーブン G. (2005)。「二次因子モデルの測定不変性のテスト」。構造方程式モデリング。12 (3): 471–492. ドイ: 10.1207/s15328007sem1203_7 . S2CID 120893307 .
^ ウィダマン、ケンタッキー州; Ferrer、E。アナゴ、RD (2010)。「縦方向の構造方程式モデル内の階乗不変性: 時間を超えて同じ構造を測定する」 . 子どもの発達の視点。4 (1): 10–18. ドイ: 10.1111/j.1750-8606.2009.00110.x . PMC 2848495 . PMID 20369028 .
^ ルブケ、GH; ら。(2003)。「共通因子モデルにおけるグループ内およびグループ間差異のソースと測定不変性との関係について」。インテリジェンス。31 (6): 543–566. ドイ:10.1016/s0160-2896(03)00051-5 .
^ ブラウン、T. (2015). 応用研究のための確認因子分析、第 2 版。ギルフォード・プレス。
^ ヴァン・デ・スクート、レンス。シュミット、ピーター。De Beuckelaer、アラン。レック、キンバリー。Zondervan-Zwijnenburg、マリエル (2015-01-01)。「社説: 測定の不変性」 . 心理学のフロンティア。6 : 1064. doi : 10.3389/fpsyg.2015.01064 . PMC 4516821 . PMID 26283995。
^ ローリン、ジョン(2004)。潜在変数モデル: 因子分析、経路分析、構造方程式分析の紹介。テイラー&フランシス。ISBN 9780805849103.
^ チャン、GW; Rensvold、RB (2002)。「測定不変性をテストするための適合度指標の評価」。構造方程式モデリング。9 (2): 233–255. ドイ: 10.1207/s15328007sem0902_5 . S2CID 32598448 .
^ ウィダマン、キース・F。トンプソン、ジェーン S. (2003-03-01)。「構造方程式モデリングにおけるインクリメンタル フィット インデックスのヌル モデルの指定について」。心理学的方法。8 (1): 16–37. CiteSeerX 10.1.1.133.489 . ドイ: 10.1037/1082-989x.8.1.16 . ISSN 1082-989X . PMID 12741671。
^ クライン、レックス(2011)。構造方程式モデリングの原則と実践。ギルフォードプレス。
^ Steenkamp、Jan-Benedict EM; Baumgartner、ハンス (1998-06-01)。「国際消費者調査における測定不変性の評価」。消費者調査のジャーナル。25 (1): 78–90. ドイ:10.1086/209528。ISSN 0093-5301 . JSTOR 10.1086/209528 .
^ アリエリー、ギャル。Davidov、Eldad (2012-09-01)。「政治学における国際的および縦断的調査による測定同等性の評価」 . ヨーロッパの政治学。11 (3): 363–377. ドイ: 10.1057/eps.2011.11 . ISSN 1680-4333。
^ ヒルシュフェルト、ゲリット。フォン・ブラッヘル、ルース (2014)。「R における複数グループ確認因子分析の改善 – 連続指標と順序指標による測定不変性のチュートリアル」 . 実用的な評価、研究および評価。19 . ドイ: 10.7275/qazy-2946 .
^ ウェルゼル、クリスチャン。ブランケルト、レナート。クルーゼ、ステファン。イングルハート、ロナルド F. (2021)。「非不変性?誤解された原因による誇張された問題」。社会学的方法と研究。1 (33): 0049124121995521.ドイ: 10.1177/0049124121995521 .
^ ウェルゼル、クリスチャン。クルーゼ、ステファン。ブランケルト、レナート (2022)。「主流に反して: 非不変性診断の限界について: Fischer 等および Meuleman 等への対応」. 社会学的方法と研究: 00491241221091754. doi : 10.1177/00491241221091754 .
^ ムールマン、バート。Żółtak、Tomasz (2022)。「比較研究で測定不変性が重要な理由。ウェルゼルらへの回答 (2021)」. 社会学的方法と研究: 00491241221091755. doi : 10.1177/00491241221091755 .”