Balanced_repeated_replication
バランスの取れた反復反復は、層化抽出によって得られた統計のサンプリング変動を推定するための統計手法です。
コンテンツ
1 手法の概要
2 ハーフサンプルの選択
2.1 簡易版 2.2 リアルなバージョン
3 BRR式
4 フェイの方法
5 も参照してください
6 参照と外部リンク
手法の概要
フルサンプルからバランスの取れたハーフサンプルを選択します。
各ハーフサンプルの対象の統計を計算します。
フルサンプル値とハーフサンプル値の差に基づいて、統計の分散を推定します。
ハーフサンプルの選択編集
簡易版
最初に、サンプルの各層に2つのユニットしか含まれていない理想的な状況を考えてみましょう。次に、各ハーフサンプルにはこれらの1つが含まれるため、ハーフサンプルは完全なサンプルの層化を共有します。ある場合の地層、私たちは、理想的にはすべて2かかりSハーフ地層を選択する方法を。ただし、sが大きい場合、これは実行不可能な場合が
取得する必要のあるハーフサンプルが少ない場合は、「バランスが取れている」ように選択されます(そのため、テクニックの名前が付けられています)。ましょHはであるアダマール行列サイズのS、及び半サンプルごとに1行を選択します。(どの行でもかまいません。重要な事実は、Hのすべての行が直交していることです。)ここで、各ハーフサンプルについて、Hの対応するエントリの符号に従って、各層から取得する単位を選択します。つまり、ハーフサンプルhの場合、H hk = -1の場合は層kから最初のユニットを選択し、H hk = + 1の場合は2番目のユニットを選択します。Hの行の直交性により、選択がハーフサンプル間で無相関になります。
リアルなバージョン
残念ながら、サイズsのアダマール行列がない場合がこの場合、sより少し大きいサイズのものを選択します。これで、選択を定義するHの部分行列は、正確に直交する行を持つ必要がなくなりましたが、Hのサイズがsよりわずかに大きい場合、行はほぼ直交します。
階層ごとのユニット数は正確に2である必要はなく、通常はそうではありません。この場合、各層のユニットは、等しいまたはほぼ等しいサイズの2つの「分散PSU」(PSU =プライマリサンプリングユニット)に分割されます。これは、ランダムに実行することも、PSUを可能な限り類似させるような方法で実行することもできます。(したがって、たとえば、ある数値パラメーターに基づいて階層化が行われた場合、各層の単位はこのパラメーターの順序でソートされ、2つのPSUに対して代替の単位が選択されます。)
階層の数が非常に多い場合は、BRRを適用する前に複数の階層を組み合わせることができます。結果として得られるグループは、「分散層」として知られています。
BRR式
ましょう、完全なサンプルから計算されるように私たちの統計量の値です。せのI(I = 1、…、N)の半サンプルについて計算対応する統計です。(nはハーフサンプルの数です。)
次に、統計のサンプリング分散の推定値は、(a i − a)2の平均です。これは(少なくとも理想的なケースでは)サンプリング分散の偏りのない推定です。
フェイの方法
フェイの方法はBRRの一般化です。代わりに、単純にハーフサイズのサンプルを取るのは、我々は完全なサンプルを毎回使用しますが、不均等な重みを持つ:Kハーフサンプルおよび2外のユニットのための- kのそれの内部ユニット用。(BRRはk = 0の場合です。)分散推定値はV /(1 − k)2です。ここで、Vは上記のBRR式で与えられた推定値です。
も参照してください
リサンプリング(統計)
参照と外部リンク
American Institutes forResearchのバランスの取れた繰り返し複製
マッカーシー、PJ(1969)。疑似複製:半分のサンプル。国際統計協会のレビュー、37(3)、239-264
Krewski、D。およびJNK Rao(1981)。層化サンプルからの推論:線形化、ジャックナイフ法、およびバランスの取れた反復複製法の特性。統計学年報、9(5)、1010-1019。
ジャドキンス、DR(1990)。分散推定のためのフェイの方法。Journal of Official Statistics、6(3)、223-239。
Rao、JNKおよびCFJ Wu(1985)。層化サンプルからの推論:非線形統計のための3つの方法の2次分析。Journal of the American Statistics Association、80(391)、620-630。