Z検定


Z-test

「Z検定」はグラフィックパイプラインの「Zテスト」手順については、
Zバッファリングを参照してください Z検定任意で統計的検定れる分布の検定統計量の下で帰無仮説は、によって近似することができる正規分布。Z検定は、分布の平均を検定します。それぞれについての有意水準における信頼区間、Zよりもそれがより便利になり、単一の臨界値を有する検定(例えば、1.96%尾2つの5用)スチューデントT検定(その臨界値サンプルサイズによって定義されます対応する自由度を介して)。

コンテンツ
1 適用性
2 手順
3 ロケーションテストでの使用
4 条件
5 例
6 ロケーションテスト以外のZテスト
7 も参照してください
8 参考文献

適用性
中心極限定理のため、多くの検定統計量は、大きなサンプルに対してほぼ正規分布しています。したがって、サンプルサイズが大きい場合、または母分散がわかっている場合は、多くの統計的検定を近似Z検定として便利に実行できます。母分散が不明であり(したがって、サンプル自体から推定する必要がある)、サンプルサイズが大きくない(n <30)場合は、スチューデントのt検定の方が適切な場合が

手順
Tが帰無仮説の下でほぼ正規分布する統計量である場合にZ検定を実行する方法は、次のとおりです。
まず、推定期待値のμ Tを帰無仮説の下で、及び推定得るSの標準偏差のTを。
次に、Tのプロパティを決定します :片側または両側。
帰無仮説のためのH 0:μ≥μ 0対代替仮説 H 1:μ<μ 0は、(一方は尾)/右上のテールです。
帰無仮説のためのH 0:μ≤μ 0代替仮説対H 1:μ>μ 0、それは下/左尾される(一方は尾)。
帰無仮説のためのH 0:μ=μ 0代替仮説対H 1:μ≠μ 0は、両側検定です。
第三に、標準スコアを計算します 。Z =(( ¯− μ
0)。 {Z = { frac {({ bar {X}}- mu _ {0})} {s}}}

  、
どの片側および両側の p値は、Φ(Z)(上部/右側のテストの場合)、Φ(-Z)(下部/左側のテストの場合)、および2Φ(-| Z | )(両側検定の場合)ここで、Φは標準正規 累積分布関数です。

ロケーションテストでの使用
「Z検定」という用語は、サンプルの分散がわかっている場合に、一連の測定値の平均を特定の定数と比較する1サンプルの位置テストを具体的に指すためによく使用されます。例えば、観測データ場合X 1、…、X Nは、(I)の独立した、(ii)は、共通の平均μを有する、および(iii)σ共通分散有する2、次いでサンプル平均Xは、平均値μを有しますと分散 σ 2 {{ frac { sigma ^ {2}} {n}}}

 。
帰無仮説は、Xの平均値が与えられた数μ0であるというものです。我々は使用することができますXを  あれば帰無仮説を棄却、検定統計量としてX  – μ 0は大きいです。
標準化された統計を計算するにはZ =(( ¯− μ 0 )。 {Z = { frac {({ bar {X}}- mu _ {0})} {s}}}

 、我々はどちらか知っておく必要がありますかσの近似値を持つ2そこから我々は計算することができ、 2= σ
2 {s ^ {2} = { frac { sigma ^ {2}} {n}}}

 。一部のアプリケーションでは、σ 2は知られているが、これは珍しいことです。
サンプルサイズが中程度または大きい場合、我々は置き換えることができ標本分散σのための2を与え、プラグインのテストを。サンプル分散の不確実性が考慮されていないため、結果のテストは正確なZテストにはなりません。ただし、サンプルサイズが小さくない限り、適切な近似になります。
T検定は、データが正確にされたときに標本分散の不確実性を考慮するために使用することができ、通常の。
Z検定とt検定の違い:Z検定は、サンプルサイズが大きい場合(n> 50)、または母分散がわかっている場合に使用されます。t検定は、サンプルサイズが小さく(n <50)、母分散が不明な場合に使用されます。
プラグインテストの使用を正当化するのに十分な大きさのサンプルサイズが一般に考えられる普遍的な定数はありません。一般的な経験則:サンプルサイズは50回以上の観測値である必要が
サンプルサイズが大きい場合、t検定手順ではZ検定手順とほぼ同じp値が得られます。
Z検定として実行できる他の位置検定は、2標本位置検定と対の差検定です。

条件
Z検定を適用できるように、一定の条件が満たされなければなりません。
妨害パラメータは既知であるか、高精度で推定する必要があります(妨害パラメータの例は、1サンプルのロケーションテストの標準偏差です)。Z検定は単一のパラメーターに焦点を合わせ、他のすべての未知のパラメーターを真の値に固定されているものとして扱います。実際には、Slutskyの定理により、迷惑パラメータの一貫した推定を「プラグイン」することは正当化できます。ただし、サンプルサイズがこれらの推定値を適度に正確にするのに十分な大きさでない場合、Z検定はうまく機能しない可能性が
検定統計量は正規分布に従う必要が一般に、検定統計量が正常に変化すると仮定して正当化するために中心極限定理に訴えます。検定統計量がほぼ正常に変化する時期については、多くの統計的研究が検定統計量の変動が非常に非正規分布である場合は、Z検定を使用しないで
上記のように妨害パラメータの推定値がプラグインされている場合は、データのサンプリング方法に適した推定値を使用することが重要です。1つまたは2つのサンプル位置問題のZ検定の特殊なケースでは、通常のサンプル標準偏差は、データが独立したサンプルとして収集された場合にのみ適切です。
状況によっては、迷惑パラメータのプラグイン推定値の変動を適切に説明するテストを考案することが可能です。1つおよび2つのサンプル位置の問題の場合、tテストがこれを行います。


特定の地理的地域で、リーディングテストのスコアの平均と標準偏差がそれぞれ100ポイントと12ポイントであると仮定します。私たちの関心は、96の平均スコアを受け取った特定の学校の55人の生徒のスコアにこの平均スコアが地域の平均よりも大幅に低いかどうか、つまり、この学校の生徒は単純ランダムに匹敵するかどうかを尋ねることができます。地域全体からの55人の学生のサンプルですか、それとも彼らのスコアは驚くほど低いですか?
まず、平均の標準誤差を計算します。 E = σ =12 5= 12 7.42 = 1.62
{ mathrm {SE} = { frac { sigma} { sqrt {n}}} = { frac {12} { sqrt {55}}} = { frac {12} {7.42}} = 1.62 、!}
  どこ σ {{ sigma}}

  母標準偏差です。
次に、zスコアを計算します。これは、サンプル平均から母平均までの距離を標準誤差の単位で表したものです。 z = −
μ E= 96 − 100 1.62 = − 2.47
{z = { frac {M- mu} { mathrm {SE}}} = { frac {96-100} {1.62}} = -2.47 、!}
  この例では、母集団の平均と分散を既知のものとして扱います。これは、地域のすべての学生がテストされた場合に適切です。母集団のパラメーターが不明な場合は、代わりにスチューデントのt検定を実行する必要が
教室の平均スコアは96で、母平均100から-2.47標準誤差単位です。標準正規分布の累積確率の表でzスコアを調べると、以下の標準正規値を観測する確率がわかります。 −2.47は約0.5 − 0.4932 = 0.0068です。これは、55人の学生がすべての受験者の母集団からの単純なランダムサンプルに匹敵するという帰無仮説の片側p値です。両側のp値は約0.014(片側のp値の2倍)です。
別の言い方をすれば、確率1 − 0.014 = 0.986の場合、55人の学生の単純ランダムサンプルは、母平均の4単位以内の平均テストスコアを持つことになります。また、98.6%の信頼度で、55人の受験者が受験者の母集団からの単純なランダムサンプルに匹敵するという帰無仮説を棄却したとも言えます。
Z関心の55人の学生が受験者の母集団から同様のサイズの最も単純無作為サンプルと比較して異常に低い平均テストのスコアを持っていることを教えてくれる-test。この分析の欠点は、4ポイントの効果量が意味があるかどうかを考慮していないことです。教室の代わりに、平均スコアが99である900人の学生を含むサブリージョンを検討した場合、ほぼ同じzスコアとp値が観察されます。これは、サンプルサイズが十分に大きい場合、null値との非常に小さな差が統計的に非常に有意になる可能性があることを示しています。この問題の詳細については、統計的仮説検定を参照して

ロケーションテスト以外のZテスト
ロケーションテストは、最もよく知られているZテストです。Z検定の別のクラスは、パラメトリック統計モデルのパラメーターの最尤推定で発生します。最尤推定値は特定の条件下ではほぼ正規分布であり、それらの漸近分散はフィッシャー情報量の観点から計算できます。最尤推定値をその標準誤差で割ったものは、パラメーターの母集団値がゼロに等しいという帰無仮説の検定統計量として使用できます。より一般的には、θ
^ {{ hat { theta}}}

 パラメータθの最尤推定値であり、θ 0は、帰無仮説下でのθの値であります(( θ^ − θ 0 )。
/ E(( θ ^ )。
{ displaystyle({ hat { theta}}- theta _ {0})/ { rm {SE}}({ hat { theta}})}
  Z検定統計として使用できます。
最尤推定にZ検定を使用する場合、サンプルサイズが十分に大きくないと、正規近似が不十分になる可能性があることに注意することが重要です。Z検定を使用するには、サンプルサイズをどれだけ大きくする必要があるかを示す単純で普遍的な規則はありませんが、シミュレーションにより、特定の状況でZ検定が適切かどうかを判断できます。
Z検定は、検定統計量が対象の帰無仮説の下で正規分布に従うと主張できる場合は常に使用されます。U統計などの多くの非パラメトリック検定統計は、十分に大きいサンプルサイズではほぼ正規分布であるため、Z検定として実行されることがよく

も参照してください
正規分布
標準正規分布表
標準得点
スチューデントのT検定

参考文献
スプリントホール、RC(2011)。基本的な統計分析(第9版)。ピアソンエデュケーション。ISBN 978-0-205-05217-2。
カゼッラ、G。、バーガー、RL(2002)。統計的推論。ダックスベリープレス。
ISBN 0-534-24312-6。 
ダグラス・C・モンゴメリー、ジョージ・C・ルンガー(2014)。エンジニアのための応用統計と確率(第6版)。John Wiley&Sons、inc。
ISBN 9781118539712、9781118645062。 “