Wilcoxon_signed-rank_test
ウィルコクソンの符号順位検定であるノンパラメトリック 統計的仮説検定サンプルのセットの位置をテストするために、または一致したサンプルのセットを使用して2つの集団の位置を比較するためにも使用します。試料の組の位置をテストするために適用される場合、それは1サンプルと同じ目的を果たすスチューデントT検定。マッチサンプルのセットで、それはペア差検定一対のスチューデントの様T検定(また、「として知られているTマッチドペア検定のためには」または「T検定従属サンプルについて」)。スチューデントのtとは異なり-検定、ウィルコクソン符号順位検定は、データが正規分布していることを前提とはし多種多様なデータセットで、スチューデントのt検定よりも統計的検出力が高く、統計的に有意な結果を生成する可能性が高くなります。この適用性の代償は、データが正規分布している場合のスチューデントのt検定よりも統計的検出力が低いことです。
コンテンツ
1 歴史
2 テスト手順
3 帰無仮説と対立仮説
3.1 1サンプルテスト 3.2 ペアデータテスト
4 ゼロとネクタイ
4.1 ゼロ 4.2 ネクタイ
5 帰無分布の計算
6 代替統計
7 例
8 効果の大きさ
9 ソフトウェアの実装
10 も参照してください
11 参考文献
12 外部リンク
歴史
この検定は、1つの論文で2つの独立したサンプルの順位和検定の両方を提案したFrank Wilcoxon(1892–1965)にちなんで名付けられました。このテストは、シドニー・シーゲル(1956)によって、ノンパラメトリック統計に関する影響力のある教科書で普及しました。シーゲルは、シンボルの使用Tを検定統計量のために、その結果、試験は、時にはと呼ばれるウィルコクソンT検定。
テスト手順
符号付き順位検定には2つのバリエーションが理論的な観点からは、ペアサンプルテストはデータを1サンプルテストの状況に変換することによって実行されるため、1サンプルテストはより基本的です。ただし、符号付き順位検定の最も実用的なアプリケーションは、ペアのデータから発生します。
ペアサンプルテストの場合、データはサンプルで構成されます(( 1 Y
1)。 … (( NS、 Y NS)。
{ displaystyle(X_ {1}、Y_ {1})、 dots、(X_ {n}、Y_ {n})}
。各サンプルは1組の測定値です。最も単純なケースでは、測定は間隔スケールで行われます。次に、それらは実数に変換され、ペアのサンプルテストは、数値の各ペアを置き換えることによって1サンプルのテストに変換されます。(( I Y
私)。
{ displaystyle(X_ {i}、Y_ {i})}
その違いによって 私
−Y I
{X_ {i} -Y_ {i}}
。一般に、ペア間の差異をランク付けできる必要がこれには、データが順序付きメトリックスケールである必要がこれは、順序スケールよりも多くの情報を伝達するタイプのスケールですが、間隔スケールよりも小さい場合が
1標本検定のデータは、実数標本のセットです。 1 …
、 {X_ {1}、 dots、X_ {n}}
。簡単にするために、サンプルはすべて異なり、ゼロに等しいサンプルはないと仮定します。(ゼロとタイはいくつかの問題を引き起こします。以下を参照して)テストは次のように実行されます。
計算 | 1 | … | |
{| X_ {1} |、 dots、| X_ {n} |}
。
これらの数量を並べ替えます。定義 1 …
、 {R_ {1}、 dots、R_ {n}}
となることによって0 <
| 1 | <
| 2 | <⋯ < || {0 <| X_ {R_ {1}} | <| X_ {R_ {2}} | < dots <| X_ {R_ {n}} |}
。
させて sgn { operatorname {sgn}}
符号関数を示します: sgn (( )。= 1
{ operatorname {sgn}(x)= 1}
もしも >> 0 {x> 0}
0″”>
と sgn (( )。= − 1
{ operatorname {sgn}(x)=-1}
もしも < 0 {x <0}
。検定統計量はある符号付き順位和 {T}
: = ∑ I= 1 sgn(( 私
)。 I {T = sum _ {i = 1} ^ {N} operatorname {sgn}(X_ {i})R_ {i}。}
を生成する {p}
-比較による価値 {T}
帰無仮説の下での分布に。
符号付き順位の合計 {T}
他の2つの検定統計量と密接に関連しています。正の順位和 +
{T ^ {+}}
と負のランクの合計 −
{T ^ {-}}
によって定義されます += 1 ≤ I
≤ 、 私 >> 0 私
、 −= 1 ≤ I
≤ 、 私 < 0 I {{ begin {aligned} T ^ {+}&= sum _ {1 leq i leq n、 X_ {i}> 0} R_ {i}、\ T ^ {-}&= sum _ {1 leq i leq n、 X_ {i} <0} R_ {i}。 end {aligned}}}
0}R_{i},\T^{-}&=sum _{1leq ileq n, X_{i}<0}R_{i}.end{aligned}}}"">
なぜなら ++ −
{T ^ {+} + T ^ {-}}
すべてのランクの合計に等しい、つまり1 + 2 + ⋯+ = (( + 1 )。/ 2
{1 + 2 + dots + n = n(n + 1)/ 2}
、これらの3つの統計は次のように関連しています。 + = (( + 1 )。 2 − −= (( + 1 )。4 2
、 −= (( + 1 )。 2 − += (( + 1 )。4 2
、= +
− − = 2 +
− (( + 1 )。 2 = (( + 1 )。2
2 − {{ begin {aligned} T ^ {+}&= { frac {n(n + 1)} {2}}-T ^ {-} = { frac {n(n + 1)} { 4}} + { frac {T} {2}}、\ T ^ {-}&= { frac {n(n + 1)} {2}}-T ^ {+} = { frac { n(n + 1)} {4}}-{ frac {T} {2}}、\ T&= T ^ {+}-T ^ {-} = 2T ^ {+}-{ frac {n (n + 1)} {2}} = { frac {n(n + 1)} {2}} -2T ^ {-}。 end {aligned}}}
なぜなら{T}
、 +
{T ^ {+}}
、 と −
{T ^ {-}}
同じ情報を持ち、それらのいずれかを検定統計量として使用できます。
正のランクの合計と負のランクの合計には、テストの背後にある理論に役立つ代替の解釈がウォルシュ平均を定義する W I {W_ {ij}}
することが1 2(( 私+ NS)。
{{ tfrac {1} {2}}(X_ {i} + X_ {j})}
。次に: += # {{ W 私>>0 : 1 ≤ I
≤ ≤ }
、 −= #
{{ W 私<0 : 1 ≤ I
≤ ≤ } {{ begin {aligned} T ^ {+} = # {W_ {ij}> 0 Colon 1 leq i leq j leq n }、\ T ^ {-} = # {W_ {ij} <0 Colon 1 leq i leq j leq n }。 end {aligned}}}
0colon 1leq ileq jleq n},\T^{-}=#{W_{ij}<0colon 1leq ileq jleq n}.end{aligned}}}"">
帰無仮説と対立仮説編集
1サンプルテスト
1サンプルのウィルコクソン符号順位検定を使用して、データが指定された中央値を持つ対称母集団からのものであるかどうかを検定できます。母集団の中央値がわかっている場合は、データがその中心に関して対称であるかどうかをテストするために使用できます。
帰無仮説と対立仮説を正式に説明するために、データが分布からの独立した同一分布のサンプルで構成されていると仮定します。 {F}
。もしも 1
{X_ {1}}
と 2
{X_ {2}}
IIDです {F}
-分散確率変数、定義 (( 2 )。 {F ^ {(2)}}
の累積分布関数になる1 2(( 1+ 2)。
{{ tfrac {1} {2}}(X_ {1} + X_ {2})}
。設定 2= Pr(( 1 2 (( 1+ 2 )。 >> 0 )。= 1
− (( 2 )。 (( 0
)。{p_ {2} = Pr({ tfrac {1} {2}}(X_ {1} + X_ {2})> 0)= 1-F ^ {(2)}(0)。}
0)=1-F^{(2)}(0).}””>
と仮定する{F}
継続的です。1標本のウィルコクソン符号順位和検定は、次の対立仮説の1つに対する次の帰無仮説の検定です。
帰無仮説 H 0 2=1 2
{p_ {2} = { tfrac {1} {2}}}
対立仮説の一方的なを 1 2
>>1 2
{p_ {2}> { tfrac {1} {2}}}
{tfrac {1}{2}}}””>
。
対立仮説の一方的なを 2 2 <1 2 {p_ {2} <{ tfrac {1} {2}}}
。
対立仮説の二つは、両面を 3 2
≠1 2
{p_ {2} neq { tfrac {1} {2}}}
。
テストされる対立仮説は、検定統計量を使用して片側または両側のp値を計算するかどうか(および片側の場合はどちらの側)によって異なります。もしも μ { mu}
は固定された所定の量である場合、テストは次の値のテストとしても使用できます。 Pr (( 1 2 (( 1+ 2)。
>> μ )。
{ Pr({ tfrac {1} {2}}(X_ {1} + X_ {2})> mu)}
mu )}””>
引くことによって μ { mu}
すべてのデータポイントから。
上記の帰無仮説と対立仮説は、 2 + / 2
{2T ^ {+} / n ^ {2}}
の一致推定量です 2
{p_ {2}}
。それはまたの記述から導き出すことができます +
{T ^ {+}}
と −
{T ^ {-}}
ウォルシュ平均に関しては、その説明は、ウィルコクソン検定がウォルシュ平均のセットに適用される符号検定と同じであることを示しているためです。
関心のある分布を制限すると、より解釈しやすい帰無仮説と対立仮説につながる可能性がやや制限的な仮定の1つは、 (( 2 )。 {F ^ {(2)}}
独自の中央値がこの中央値が呼び出されpseudomedianの {F}
; 一般に、3つすべてが存在する場合でも、平均および中央値とは異なります。一意の疑似中央値の存在が帰無仮説と対立仮説の両方で真であると見なすことができる場合、これらの仮説は次のように言い換えることができます。
帰無仮説
の疑似中央値 {F}
ゼロに
対立仮説の一方的なを 1
の疑似中央値 {F}
にありますμ < 0
{ mu <0}
。
対立仮説の一方的なを 2
の疑似中央値 {F}
にあります μ >> 0 { mu> 0}
0″”>
。
対立仮説の二つは、両面を 3
の疑似中央値 {F}
にありますμ ≠ 0
{ mu neq 0}
。
ほとんどの場合、帰無仮説と対立仮説は対称性の仮定の下で述べられます。実数を修正する μ { mu}
。定義 {F}
対称になる μ { mu}
確率変数の場合 {X}
配布あり {F}
満たす Pr (( ≤ μ − )。= Pr(( ≥ μ + )。
{ Pr(X leq mu -x)= Pr(X geq mu + x)}
すべてのために {x}
。もしも {F}
密度関数を持っています {f}
、 それから {F}
について対称です μ { mu}
場合に限り (( μ+ )。= (( μ
− )。
{f( mu + x)= f( mu -x)}
すべてのための {x}
。
の帰無および対立分布の場合 {F}
対称であると見なすことができる場合、帰無仮説と対立仮説は次のように単純化されます。
帰無仮説 H 0 {F}
について対称ですμ = 0
{ mu = 0}
。
対立仮説の一方的な Hを 1 {F}
について対称ですμ < 0
{ mu <0}
。
対立仮説の一方的な Hを 2 {F}
について対称です μ >> 0 { mu> 0}
0″”>
。
対立仮説の二つは、両面 Hを 3 {F}
について対称ですμ ≠ 0
{ mu neq 0}
。
さらに場合 Pr (( = μ )。= 0
{ Pr(X = mu)= 0}
、 それから μ { mu}
の中央値です {F}
。この中央値が一意である場合、Wilcoxon符号付きランク合計テストは中央値の位置のテストになります。平均が {F}
が定義されている場合、平均は μ { mu}
、およびテストは、平均の位置のテストでも
代替分布が対称であるという制限は非常に制限されていますが、片側テストの場合は弱めることができます。と言う {F}
次の場合、ゼロについて対称な分布よりも確率的に小さい {F}
-分散確率変数 {X}
満足する Pr (( <
− )。≥ Pr(( >> )。
{ Pr(X <-x) geq Pr(X> x)}
x)}””>
すべてのために ≥ 0 {x geq 0}
。同様に、 {F}
次の場合、ゼロについて対称な分布よりも確率的に大きい Pr (( <
− )。≤ Pr(( >> )。
{ Pr(X <-x) leq Pr(X> x)}
x)}””>
すべてのために ≥ 0 {x geq 0}
。次に、ウィルコクソンの符号付き順位和検定は、次の帰無仮説および対立仮説にも使用できます。
帰無仮説 H 0 {F}
について対称ですμ = 0
{ mu = 0}
。
対立仮説の一方的な Hを 1 {F}
は、ゼロに関して対称な分布よりも確率的に小さくなります。
対立仮説の一方的な Hを 2 {F}
は、ゼロに関して対称な分布よりも確率的に大きくなります。
データがIIDであるという仮説は弱められる可能性がすべての分布が連続的であり、共通の点に関して対称であると想定される限り、各データ点は異なる分布から取得できます。μ 0
{ mu _ {0}}
。データポイントは、他の観測値が対称である限り、各観測値の条件付き分布が独立している必要はありません。μ 0
{ mu _ {0}}
。
ペアデータテスト
対のデータ検定は対の差を取ることから生じるため、その帰無仮説と対立仮説は、1標本検定の仮説から導き出すことができます。いずれの場合も、それらは違いの振る舞いについての主張になります 私
−Y I
{X_ {i} -Y_ {i}}
。
させて (( 、 y )。
{F(x、y)}
ペアの共同累積分布である(( I Y
私)。
{ displaystyle(X_ {i}、Y_ {i})}
。もしも {F}
が連続である場合、最も一般的な帰無仮説と対立仮説は次のように表されます。 2= Pr(( 1 2 (( 私 − Y I + −
Y )。
>> 0 )。
{p_ {2} = Pr({ tfrac {1} {2}}(X_ {i} -Y_ {i} + X_ {j} -Y_ {j})> 0)}
0)}””>
およびは、1サンプルの場合と同じです。
帰無仮説 H 0 2=1 2
{p_ {2} = { tfrac {1} {2}}}
対立仮説の一方的なを 1 2
>>1 2
{p_ {2}> { tfrac {1} {2}}}
{tfrac {1}{2}}}””>
。
対立仮説の一方的なを 2 2 <1 2 {p_ {2} <{ tfrac {1} {2}}}
。
対立仮説の二つは、両面を 3 2
≠1 2
{p_ {2} neq { tfrac {1} {2}}}
。
1標本の場合と同様に、いくつかの制限の下で、検定は、差の疑似中央値がゼロにあるかどうかの検定として解釈できます。
一般的な制限は、差異の対称分布です。この場合、帰無仮説と対立仮説は次のとおりです。
帰無仮説
観察 私− Y I
{X_ {i} -Y_ {i}}
について対称ですμ = 0
{ mu = 0}
。
対立仮説の一方的なを 1
観察 私− Y I
{X_ {i} -Y_ {i}}
について対称ですμ < 0
{ mu <0}
。
対立仮説の一方的なを 2
観察 私− Y I
{X_ {i} -Y_ {i}}
について対称です μ >> 0 { mu> 0}
0″”>
。
対立仮説の二つは、両面を 3
観察 私− Y I
{X_ {i} -Y_ {i}}
について対称ですμ ≠ 0
{ mu neq 0}
。
これらは、元のペアに関してより直接的に表現することもできます。
帰無仮説
観察(( I Y I )。
{ displaystyle(X_ {i}、Y_ {i})}
ある
交換可能なことを意味し、(( I Y I )。
{ displaystyle(X_ {i}、Y_ {i})}
と(( Y I 、 私 )。 { displaystyle(Y_ {i}、X_ {i})}
同じ分布を持っています。同等に、 (( 、 y )。= (( y
、 )。
{F(x、y)= F(y、x)}
。
対立仮説の一方的なを 1
いくつかのためのμ < 0
{ mu <0}
、ペア(( I Y I )。
{ displaystyle(X_ {i}、Y_ {i})}
と(( YI + μ
、 私− μ )。 { displaystyle(Y_ {i} + mu、X_ {i}- mu)}
同じ分布を持っています。
対立仮説の一方的なを 2
いくつかのための μ >> 0 { mu> 0}
0″”>
、ペア(( I Y I )。
{ displaystyle(X_ {i}、Y_ {i})}
と(( YI + μ
、 私− μ )。 { displaystyle(Y_ {i} + mu、X_ {i}- mu)}
同じ分布を持っています。
対立仮説の二つは、両面を 3
いくつかのためのμ ≠ 0
{ mu neq 0}
、ペア(( I Y I )。
{ displaystyle(X_ {i}、Y_ {i})}
と(( YI + μ
、 私− μ )。 { displaystyle(Y_ {i} + mu、X_ {i}- mu)}
同じ分布を持っています。
交換可能性の帰無仮説は、治療群と対照群を用いたマッチドペア実験から生じる可能性が各ペア内の処理と制御をランダム化すると、観察結果が交換可能になります。交換可能なディストリビューションの場合、 私
−Y I
{X_ {i} -Y_ {i}}
と同じ分布を持っています
Y I − 私
{Y_ {i} -X_ {i}}
、したがって、帰無仮説の下では、分布はゼロに関して対称です。
1標本検定は確率的優位性の片側検定として使用できるため、対差ウィルコクソン検定を使用して次の仮説を比較できます。
帰無仮説
観察(( I Y I )。
{ displaystyle(X_ {i}、Y_ {i})}
交換可能です。
対立仮説の一方的なを 1
違い 私− Y I
{X_ {i} -Y_ {i}}
は、ゼロに関して対称な分布よりも確率的に小さくなります。 ≥ 0 {x geq 0}
、 (( 私< Y I
− )。≥ Pr(( 私
>>Y I+ )。
{Pr(X_ {i}
Y_{i}+x)}””>
。
対立仮説の一方的なを 2
違い 私− Y I
{X_ {i} -Y_ {i}}
は、ゼロに関して対称な分布よりも確率的に大きくなります。 ≥ 0 {x geq 0}
、 (( 私< Y I
− )。≤ Pr(( 私
>>Y I+ )。
{Pr(X_ {i}
Y_{i}+x)}””>
。
ゼロとネクタイ
実際のデータでは、サンプルがある場合があります 私
{X_ {i}}
これはゼロまたはペアに等しい(( I Y
私)。
{ displaystyle(X_ {i}、Y_ {i})}
と 私=Y I
{X_ {i} = Y_ {i}}
。結ばれたサンプルがある場合もこれは、一部の人にとっては I ≠ {i neq j}
、 我々は持っています 私= {X_ {i} = X_ {j}}
(1サンプルの場合)または 私
−Y I −
Y {X_ {i} -Y_ {i} = X_ {j} -Y_ {j}}
(ペアのサンプルの場合)。これは、離散データで特に一般的です。これが発生した場合、データを一意にランク付けする方法がないため、上記で定義されたテスト手順は通常未定義です。(唯一の例外は、サンプルが1つしかない場合です。 私
{X_ {i}}
これはゼロであり、他のゼロや同点はありません。)このため、検定統計量を変更する必要が
ゼロ
Wilcoxonの元の論文は、ゼロに等しい観測値(または、ペアのサンプルの場合は差)の問題に対処していませんでした。ただし、後の調査で、彼はサンプルからゼロを削除することを推奨しました。次に、同点がない限り、標準の符号付き順位検定を結果のデータに適用できます。これは現在、縮小サンプル手順と呼ばれています。
プラットは、サンプル手順の削減が逆説的な行動につながる可能性があることを観察しました。彼は次の例を挙げています。1サンプルの状況にあり、次の13の観測値があるとします。
0、2、3、4、6、7、8、9、11、14、15、17、-18。
削減されたサンプル手順は、ゼロを削除します。残りのデータに、署名されたランクを割り当てます。
1、2、3、4、5、6、7、8、9、10、11、-12。
これは片側のp値が 55 / 12
{55/2 ^ {12}}
、したがって、サンプルはどの有意水準でも有意に陽性ではありませんα < 55
/ 12 0.0134 { alpha <55/2 ^ {12} 約0.0134}
。プラットは、観測値を減らしてもデータがよりポジティブに見えることは確かではないと予想されると主張しています。ただし、ゼロの観測値が2未満の量だけ減少した場合、またはすべての観測値が1未満の量だけ減少した場合、符号付きランクは次のようになります。-1、2、3、4、5、6、7、8、9、10、11、12、-13。
これは片側のp値が 109 / 13
{109/2 ^ {13}}
。したがって、サンプルは任意の有意水準で有意に陽性と判断されます α >> 109 / 13 0.0133 { alpha> 109/2 ^ {13} upperx 0.0133}
109/2^{13}approx 0.0133}””>
。パラドックスは、 α { alpha}
は間に 109 / 13
{109/2 ^ {13}}
と 55 / 12
{55/2 ^ {12}}
、次に重要でないサンプルを減らすと、サンプルは大幅にポジティブに見えます。
したがって、プラットは符号付き順位ゼロの手順を提案しました。この手順には、サンプルをランク付けするときにゼロが含まれます。ただし、それらを検定統計量から除外するか、同等に定義します sgn (( 0
)。= 0
{ operatorname {sgn}(0)= 0}
。プラットは、符号付き順位ゼロの手順には、縮小されたサンプル手順では共有されないいくつかの望ましい動作があることを証明しました。
観測値を増やしても、有意に正のサンプルが有意でなくなることはなく、有意でないサンプルが有意に負になることもありません。
観測値の分布が対称である場合、 μ { mu}
テストは間隔から拒否しません。
サンプルは、ゼロに任意の非ゼロ符号が割り当てられている場合にのみ、ゼロが非ゼロ値に置き換えられた場合にのみ、有意に正、有意ではない、または有意に負になります。ゼロ以外の観測値よりも絶対値が小さい。
固定有意性しきい値の場合 α { alpha}
、および正確にレベルを持つようにランダム化されたテストの場合 α { alpha}
、一連の観測値を有意に正(または有意に負)と呼ぶ確率は、観測値の非減少(それぞれ、非増加)関数です。
プラットは、符号付き順位ゼロの手順を平均ランクの手順と組み合わせて同点を解決すると、結果の検定は、すべての対立仮説に対する一貫した検定になると述べています。 I ≠ {i neq j}
、 Pr (( 私+>> 0 )。
{ Pr(X_ {i} + X_ {j}> 0)}
0)}””>
と Pr (( 私< 0 )。 { Pr(X_ {i} + X_ {j} <0)}
少なくとも独立した固定定数が異なる I {i}
と {j}
。
符号付き順位ゼロの手順には、ゼロが発生すると、検定統計量の帰無分布が変化するため、p値のテーブルを使用できなくなるという欠点が
データが等間隔のカテゴリを持つリッカート尺度である場合、符号付き順位ゼロの手順は、削減されたサンプル手順よりもタイプIのエラー率を維持する可能性が高くなります。
統計効率の観点から、ゼロを処理するための完全なルールはありません。コノバーは、ウィルコクソンの方法とプラットの方法のどちらも他よりも一様に優れていないことを示す帰無仮説と対立仮説の例を見つけました。離散一様分布を、確率が左から右に直線的に増加する分布と比較すると、プラットの方法はウィルコクソンの方法よりも優れています。ゼロを中心とする二項分布をテストして、各ベルヌーイ試行のパラメーターが1 2
{{ tfrac {1} {2}}}
、ウィルコクソンの方法はプラットの方法よりも優れています。
ネクタイ
データに同点がない場合、ランク 私
{R_ {i}}
検定統計量の計算に使用されます。同点の場合、ランクは定義されません。これを解決するには、主に2つのアプローチが
同点を処理するための最も一般的な手順、およびウィルコクソンによって最初に推奨された手順は、平均ランクまたは中間ランク手順と呼ばれます。この手順では、1からnまでの番号を観測値に割り当て、2つの観測値が同じ絶対値を持っている場合にのみ、同じ番号を取得します。これらの番号のセットが等しくない場合でも、これらの番号は通常、ランクと呼ばれます。
{{ 1 … 、 }
{ {1、 dots、n }}
(同点がない場合を除く)。オブザベーションに割り当てられたランクは、すべての可能な方法でタイが切断された場合に得られる可能性のあるランクの平均です。ランクが割り当てられると、通常と同じ方法で検定統計量が計算されます。
たとえば、観測値が次の条件を満たすとします。
| 3| <
| 2| =
| 5| <
| 6| <
| 1| =
| 4| = | 7 |{| X_ {3} | <| X_ {2} | = | X_ {5} | <| X_ {6} | <| X_ {1} | = | X_ {4} | = | X_ {7} |。}
この場合、 3
{X_ {3}}
ランク1が割り当てられます 2
{X_ {2}}
と 5
{X_ {5}}
ランクが割り当てられます(( 2+ 3
)。/ 2 = 2.5
{ displaystyle(2 + 3)/ 2 = 2.5}
、 6
{X_ {6}}
ランク4が割り当てられ、 1
{X_ {1}}
、 4
{X_ {4}}
、 と 7
{X_ {7}}
ランクが割り当てられます(( 5+ 6 + 7
)。/ 3 = 6
{ displaystyle(5 + 6 + 7)/ 3 = 6}
。正式には、すべて同じ絶対値を持つ一連の観測値があるとします。v v}
、 それk − 1
{k-1}
観測値の絶対値はv v}
、そしてそれ ℓ { ell}
観測値の絶対値は以下ですv v}
。観測値が絶対値で結びついている場合v v}
壊れた場合、これらの観測はランクを占めることになりますk k}
使って ℓ { ell}
。したがって、平均ランク手順はそれらにランクを割り当てます(( k+ ℓ
)。/ 2
{ displaystyle(k + ell)/ 2}
。
平均ランク手順では、同点が存在する場合、帰無分布は異なります。 平均ランク手順には、ゼロの縮小サンプル手順と同様のいくつかの欠点もサンプルは、平均ランク手順によって有意に陽性と判断される可能性がただし、一部の値を増やして同点を解除したり、何らかの方法で同点を解除したりすると、テストで有意ではないと判断されるサンプルが生成されます。 ただし、すべての観測値を同じ量だけ増やしても、有意に正の結果を有意でない結果に変えることも、有意でない結果を有意に負の結果に変えることもできません。さらに、観測値が対称的に分布している場合、 μ { mu}
テストは間隔から拒否しません。
タイを処理するための他の一般的なオプションは、タイブレーク手順です。タイブレーク手順では、観測値にはセット内の個別のランクが割り当てられます
{{ 1 … 、 }
{ {1、 dots、n }}
。オブザベーションに割り当てられるランクは、その絶対値とタイブレークルールによって異なります。絶対値が小さい観測値には、標準の順位和検定と同様に、常に小さいランクが与えられます。タイブレークルールは、同じ絶対値を持つ観測値にランクを割り当てるために使用されます。タイブレークルールの利点の1つは、p値の計算に標準テーブルを使用できることです。
ランダムなタイブレークは、ランダムにタイを解除します。ランダムタイブレークでは、帰無分布はタイがない場合と同じですが、テストの結果はデータだけでなく、追加のランダムな選択にも依存します。可能なランダムな選択に対してランクを平均すると、平均ランク手順になります。すべてのランダムな選択に対する拒否の確率を報告することもできます。ランダムタイブレークには、いくつかの観測値が増加しても、サンプルが有意に陽性であると判断される確率が低下しないという利点が 保守的なタイブレークは、帰無仮説を支持してタイブレークを解除します。の負の値が {T}
より重要になる傾向があり、ネガティブな観測値に低いランクを割り当て、ポジティブな観測値に高いランクを割り当てることで、関係が解消されます。テストで正の値が得られたとき {T}
重要なのは、他の方法で関係が壊れていることです。 {T}
重要である、を作るために結びつきが壊れている
| |
{| T |}
できるだけ小さくします。プラットは、同点になる可能性が高い場合、保守的なタイブレーク手順は「帰無仮説を支持してすべてのタイを解除することになるため、おそらくパワーが低い」と述べています。
平均ランクの手順は、タイブレークの手順と一致しない場合がプラットは次の例を示します。観察結果が次のとおりであると仮定します。
1、1、1、1、2、3、-4。
平均ランク手順は、これらに署名されたランクを割り当てます
2.5、2.5、2.5、2.5、5、6、-7。
このサンプルは、片側レベルで有意に陽性ですα = 14 / 7 { alpha = 14/2 ^ {7}}
。一方、タイブレークルールはランクを割り当てます
1、2、3、4、5、6、-7。
同じ一方的なレベルでα = 14 / 7 { alpha = 14/2 ^ {7}}
、これは重要ではありません。
タイを処理するための他の2つのオプションは、タイブレークの結果の平均に基づいています。平均統計的方法、検定統計量 {T}
は、タイを壊す可能性のあるすべての方法について計算され、最終的な統計は、タイを壊した統計の平均です。で平均確率法、Pの-valueは関係を破壊するあらゆる可能な方法のために計算され、最終のp -値は、タイ破壊の平均であるのp -値。
帰無分布の計算
p値を計算するには、次の分布を知る必要が {T}
帰無仮説の下で。この分布の閉じた式はありません。ただし、値が小さい場合 {n}
、分布は正確に計算できます。データがゼロに関して対称であるという帰無仮説の下で、それぞれ 私
{X_ {i}}
負であるのとまったく同じように正である可能性がしたがって、 = {T = t}
帰無仮説の下では、次のような符号の組み合わせの数に等しくなります。 = {T = t}
可能な記号の組み合わせの数で割った値
2 {2 ^ {n}}
。これは、の正確な分布を計算するために使用できます {T}
帰無仮説の下で。
の分布の計算 {T}
すべての可能性を考慮することにより、コンピューティングが必要です
2 {2 ^ {n}}
合計、これは最小のものを除いてすべてにとって手に負えない {n}
。ただし、次の分布には効率的な再帰が +
{T ^ {+}}
。 定義
u(( +)。
{u_ {n}(t ^ {+})}
記号の組み合わせの数になる += +
{T ^ {+} = t ^ {+}}
。これは、のサブセットの数と同じです。
{{ 1 … 、 }
{ {1、 dots、n }}
合計は +
{t ^ {+}}
。再帰の基本ケースは次のとおりです。u 0 ( 0 )。= 1
{u_ {0}(0)= 1}
、 0(( +)。= 0
{u_ {0}(t ^ {+})= 0}
すべてのために + 0
{t ^ {+} neq 0}
、 と
u(( +)。= 0
{u_ {n}(t ^ {+})= 0}
すべてのために < 0 {t <0}
また >> (( + 1 )。/ 2
{t> n(n + 1)/ 2}
n(n+1)/2}””>
。再帰式は
u (( +
)。 = u − 1 (( +
)。 + u − 1 (( +
− )。{u_ {n}(t ^ {+})= u_ {n-1}(t ^ {+})+ u_ {n-1}(t ^ {+}-n)。}
のすべてのサブセットが
{{ 1 … 、 }
{ {1、 dots、n }}
合計すると +
{t ^ {+}}
どちらも含まれていません{n}
、この場合、それはのサブセットでもあります {{ 1 …
、 −1 }
{ {1、 dots、n-1 }}
、または含まれています{n}
、その場合は削除{n}
サブセットからのサブセットを生成します {{ 1 …
、 −1 }
{ {1、 dots、n-1 }}
合計すると +
−{t ^ {+}-n}
。帰無仮説の下で、の確率質量関数 +
{T ^ {+}}
満たす Pr (( += +
)。 = u (( +
)。 / 2 { Pr(T ^ {+} = t ^ {+})= u_ {n}(t ^ {+})/ 2 ^ {n}}
。関数
u {u_ {n}}
整数分配関数と密接に関連してい
もしも(( +)。
{p_ {n}(t ^ {+})}
の確率は += +
{T ^ {+} = t ^ {+}}
ある場合の帰無仮説の下で {n}
サンプル、次に(( +)。
{p_ {n}(t ^ {+})}
同様の再帰を満たします:
2 (( + )。 = − 1 (( + )。 + − 1 (( +
− )。
{2p_ {n}(t ^ {+})= p_ {n-1}(t ^ {+})+ p_ {n-1}(t ^ {+}-n)}
同様の境界条件で。累積分布関数の再帰式もあります Pr (( +
≤ + )。 { Pr(T ^ {+} leq t ^ {+})}
。
非常に大きい場合 {n}
、上記の再帰でも遅すぎます。この場合、帰無分布を近似できます。のヌル分布 {T}
、 +
{T ^ {+}}
、 と −
{T ^ {-}}
平均と分散を伴う漸近正規分布: E = (( + 1 )。 4 E = 0 Var ((NS+)。= Var ((NS − )。= (( + 1 )。(( 2 + 1 )。 24 Var (( )。= (( + 1 )。(( 2 + 1 )。
6 {{ begin {aligned} mathbf {E} &= mathbf {E} = { frac {n(n + 1)} {4} }、\ mathbf {E} &= 0、\ operatorname {Var}(T ^ {+})&= operatorname {Var}(T ^ {-})= { frac {n (n + 1)(2n + 1)} {24}}、\ operatorname {Var}(T)&= { frac {n(n + 1)(2n + 1)} {6}}。 end {aligned}}}
Edgeworth展開を使用すると、より適切な近似を生成できます。4次のエッジワース展開を使用すると、次のことがわかります。 Pr (( +≤ k
)。≈ Φ(( )。+ ϕ(( )。(( 32 + 3 − 1 10 (( + 1 )。(( 2 + 1 )。 )。 (( 3 − 3 )。{ Pr(T ^ {+} leq k) approx Phi(t)+ phi(t){ Big(} { frac {3n ^ {2} + 3n-1} {10n( n + 1)(2n + 1)}} { Big)}(t ^ {3} -3t)、}
どこ = k +1 2
− (( + 1 )。
4 (( + 1 )。(( 2 + 1 )。
6{t = { frac {k + { tfrac {1} {2}}-{ frac {n(n + 1)} {4}}} { sqrt { frac {n(n + 1) (2n + 1)} {6}}}}。}
従来のエッジワース展開はIID連続確率変数の合計に適用されるため、これらの展開の技術的基盤はかなり複雑ですが、 +
{T ^ {+}}
は、同一に分布していない離散確率変数の合計です。ただし、最終的な結果として、上記の展開には次のエラーが O (( −3 / 2 )。
{O(n ^ {-3/2})}
、従来の4次エッジワース拡張と同じです。
のモーメント母関数 {T}
正確な式は次のとおりです。 (( )。= 1
2 ∏ =
1 (( 1 + e )。{M(t)= { frac {1} {2 ^ {n}}} prod _ {j = 1} ^ {n}(1 + e ^ {jt})。}
ゼロが存在し、符号付きランクのゼロ手順が使用される場合、またはタイが存在し、平均ランク手順が使用される場合、 {T}
変化します。キュアトンは、この状況の正規近似を導き出しました。 元の観測数が {n}
ゼロの数は z {z}
。ネクタイ修正は = ∑ 3 − 、
{c = sum t ^ {3} -t、}
合計がすべてのサイズを超えている場合{t}
結ばれた観測の各グループの。の期待{T}
の期待値はまだゼロですが +
{T ^ {+}}
は E = (( + 1 )。
4 − z(( z+ 1 )。 4{ mathbf {E} = { frac {n(n + 1)} {4}}-{ frac {z(z + 1)} {4}}。}
もしもσ 2= (( + 1 )。(( 2 + 1 )。 − z(( z+ 1 )。 (( 2z + 1 )。 − / 2 6{ sigma ^ {2} = { frac {n(n + 1)(2n + 1)-z(z + 1)(2z + 1)-c / 2} {6}}、}
それから Var (( )。 2 Var ((NS+)。 2 / 4.4。
{{ begin {aligned} operatorname {Var}(T)&= sigma ^ {2}、\ operatorname {Var}(T ^ {+})&= sigma ^ {2} / 4 。 end {aligned}}}
代替統計
ウィルコクソンは当初、ウィルコクソン順位和統計を次のように定義しました。
最小(( +、 − )。
{ min(T ^ {+}、T ^ {-})}
。Siegel などの初期の著者はWilcoxonをフォローしました。これは両側仮説検定には適切ですが、片側検定には使用できません。
1からnまでのランクを割り当てる代わりに、0からnまでのランクを割り当てることもできます。 − 1 {n-1}
。これらは変更されたランクと呼ばれます。修正された符号付き順位の合計 0
{T_ {0}}
、修正された正のランクの合計 0 + {T_ {0} ^ {+}}
、および修正された負のランクの合計 0 − {T_ {0} ^ {-}}
と同様に定義されます {T}
、 +
{T ^ {+}}
、 と −
{T ^ {-}}
しかし、通常のランクの代わりに変更されたランクを使用します。2つの独立した合計が {F}
-分布確率変数が正である場合、次のように推定できます。2 0 + /(( (( − 1 )。 )。 {2T_ {0} ^ {+} /(n(n-1))}
。考慮が連続分布に制限されている場合、これは最小分散不偏推定量です。 2
{p_ {2}}
。
例 I {i}
2 私
{x_ {2、i}}
1 私
{x_ {1、i}}
2 私
− 1 私
{x_ {2、i} -x_ {1、i}}
sgn { operatorname {sgn}}
腹筋
{{ text {abs}}}
1 125 110 1 15 2 115 122
–17 3 130 125 1 5 4 140 120 70 71 72 73140 0 6 115 124
–19 7 140 123 1 17 8 125 137
–112 9 140 135 1 5 10 135 145
–1 10 絶対差による順序 I {i}
2 私
{x_ {2、i}}
1 私
{x_ {1、i}}
2 私
− 1 私
{x_ {2、i} -x_ {1、i}}
sgn { operatorname {sgn}}
腹筋
{{ text {abs}}}
私
{R_ {i}}
sgn ⋅ 私
{ operatorname {sgn} cdot R_ {i}}
5 140 140 0
3 130 125 1 5 1.5 1.59 140 135 1 5 1.5 1.52 115 122
–17 3
–36 115 124
–19 4
–410 135 145
–110 5
–58 125 137
–112 6
–61 125 110 1 15 7 7 7 140 10 11 12 138 4 140 120 1 20 9 9 sgn { operatorname {sgn}}
ある符号関数は、
腹筋
{{ text {abs}}}
は絶対値であり、 私
{R_ {i}}
あるランク。ペア3と9が絶対値で結ばれていることに注意してそれらは1と2にランク付けされるため、それぞれがそれらのランクの平均1.5を取得します。W = 1.5 + 1.5 − 3 − 4 W0 W1 W2 W3+ 7 + 8 + 9 = 9
{W = 1.5 + 1.5-3-4-5-6 + 7 + 8 + 9 = 9}
| W | < W クリティカル(( α = 0.05 9
、両面
)。= 15
{| W |
∴ 拒否できませんでした 0
{したがって、{ text {拒否できませんでした}} H_ {0}}
ペアワイズ差の中央値がゼロとは異なること。 {p}
-この結果の値は 0.6113 {0.6113}
効果の大きさ
Mann–Whitney_U_test§ランク-biserial_correlation
符号付き順位検定の効果量を計算するには、ランク-バイシリアル相関を使用できます。
検定統計量Tが報告された場合、順位相関rは、検定統計量Tを合計順位合計Sで割った値、または r = T / Sに等しくなります。上記の例を使用すると、検定統計量はT = 9です。サンプルサイズ9は、合計ランク合計がS =(1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9)= 45です。したがって、順位相関は9/45であるため、r = 0.20です。
検定統計量Tが報告されている場合、順位相関を計算する同等の方法は、2つの順位和の比率の差を使用することです。これは、Kerby(2014)の単純な差の式です。現在の例を続けると、サンプルサイズは9であるため、合計ランク合計は45です。Tは2つのランク合計の小さい方であるため、Tは3 + 4 + 5 + 6 = 18です。この情報から残りのランク合計は、合計SからTを引いたものであるため、単独で計算できます。この場合、45 − 18 = 27です。次に、2つのランク合計の比率は27/45 = 60%と18/45 =です。 40%。最後に、順位相関は2つの比率の差(.60から.40を引いたもの)であるため、r = .20です。
ソフトウェアの実装
Rには、としてテストの実装が含まれますwilcox.test(x,y, paired=TRUE)。ここで、xとyは同じ長さのベクトルです。
ALGLIBには、C ++、C#、Delphi、VisualBasicなどでのウィルコクソン符号順位検定の実装が含まれています。
GNU Octaveは、wilcoxon_test関数にテストのさまざまな片側バージョンと両側バージョンを実装します。
SciPyには、Pythonでのウィルコクソン符号順位検定の実装が含まれています
Accord.NETには、.NETアプリケーション用のC#でのウィルコクソン符号順位検定の実装が含まれています= signrank(x、y)もテストの決定を示す論理値を返すため、MATLABは「Wilcoxonランク合計テスト」を使用してこのテストを実装します。結果h = 1は帰無仮説の棄却を示し、h = 0は5%の有意水準で帰無仮説の棄却に失敗したことを示します。
Julia HypothesisTestsパッケージには、「value(SignedRankTest(x、y))」としてウィルコクソン符号順位検定が含まれています。
も参照してください
マン・ホイットニー・ウィルコクソン検定
符号検定
参考文献
^ Conover、WJ(1999)。実用的なノンパラメトリック統計(第3版)。ジョン・ワイリー&サンズ社ISBN 0-471-16068-7。、 NS。350 ^ 「ウィルコクソン符号順位検定-生物統計ハンドブック」。www.biostathandbook.com 。2021-09-02を取得しました。
^ ウィルコクソン、フランク(1945年12月)。「ランク付け方法による個別比較」(PDF)。バイオメトリクス速報。1(6):80–83。土井:10.2307 / 3001968。hdl:10338.dmlcz / 135688。JSTOR 3001968。
^ Siegel、シドニー(1956)。行動科学のノンパラメトリック統計。ニューヨーク:マグロウヒル。pp。75–83。ISBN 9780070573482。
^ コノバー、p。352 ^ Siegel、p。76 ^ コノバー、p。353 ^ プラット、ジョンW。; ギボンズ、ジャンD.(1981)。ノンパラメトリック理論の概念。Springer-Verlag。ISBN 978-1-4612-5933-6。、 NS。148 ^ プラットとギボンズ、p。148 ^ プラットとギボンズ、p。148 ^ プラットとギボンズ、p。150 ^ Conover、pp。352–357 ^ Hettmansperger、Thomas P.(1984)。ランクに基づく統計的推論。ジョンワイリー&サンズ。ISBN 0-471-88474-X。、pp。32、50 ^ プラットとギボンズ、p。153 ^ プラットとギボンズ、153〜154ページ ^ Hettmansperger、38〜39ページ ^ プラットとギボンズ、146〜147ページ ^ プラットとギボンズ、146〜147ページ ^ Hettmansperger、pp。30–31 ^ コノバー、p。353 ^ プラットとギボンズ、155〜156ページ ^ Hettmansperger、49〜50ページ ^ プラットとギボンズ、p。155 ^ コノバー、p。354 ^ ホランダー、マイルズ; ウルフ、ダグラスA。; チキン、エリック(2014)。ノンパラメトリック統計手法(第3版)。ジョン・ワイリー&サンズ社ISBN 978-0-470-38737-5。、pp。39–41 ^ プラットとギボンズ、p。147 ^ プラットとギボンズ、p。147 ^ Hettmansperger、49〜50ページ ^ ウィルコクソン、フランク(1949)。いくつかの迅速な近似統計手順。American Cynamic Co.
^ プラット、J。(1959)。「ウィルコクソンの符号付き順位検定におけるゼロとタイに関する注意」。アメリカ統計協会誌。54(287):655–667。土井:10.1080 /01621459.1959.10501526。
^ プラット、p。659 ^ プラット、p。663 ^ デリック、B; ホワイト、P(2017)。「個々のリッカート質問からの2つのサンプルの比較」。数学と統計の国際ジャーナル。18(3):1–13。
^ Conover、William Jay(1973)。「ウィルコクソン符号順位検定でネクタイを処理する方法について」。アメリカ統計協会誌。68(344):985–988。
^ プラットとギボンズ、p。162 ^ Conover、pp。352–353 ^ プラットとギボンズ、p。164 ^ Conover、pp。358–359 ^ プラット、p。660 ^ プラットとギボンズ、168〜169ページ ^ プラット、pp。661–662 ^ プラットとギボンズ、p。170 ^ プラットとギボンズ、pp。163、166 ^ プラット、p。660 ^ プラットとギボンズ、p。166 ^ プラットとギボンズ、p。171 ^ プラット、p。661 ^ プラット、p。660 ^ ギボンズ、ジャンD。; Chakraborti、Subhabrata(2011)。ノンパラメトリック統計的推論(第5版)。チャップマン&ホール/ CRC。ISBN 978-1-4200-7762-9。、 NS。194 ^ Hettmansperger、p。34 ^ プラットとギボンズ、148〜149ページ ^ プラットとギボンズ、148〜149ページ、186〜187ページ ^ Hettmansperger、p。171 ^ プラットとギボンズ、p。187 ^ プラットとギボンズ、p。187 ^ プラットとギボンズ、p。187 ^ プラットとギボンズ、p。149 ^ Kolassa、John E.(1995)。「ランク合計検定統計のエッジワース近似」。統計と確率の手紙。24:169–171。
^ Hettmansperger、p。37 ^ Hettmansperger、p。35 ^ キュアトン、エドワードE.(1967)。「差がゼロの場合の符号付き順位サンプリング分布の正規近似」。アメリカ統計協会誌。62(319):1068-1069。
^ プラットとギボンズ、p。193 ^ ウィルコクソン、p。82 ^ Siegel、p。76 ^ プラットとギボンズ、p。158 ^ プラットとギボンズ、p。159 ^ プラットとギボンズ、p。191 ^ Kerby、Dave S.(2014)、「単純な差分式:ノンパラメトリック相関を教えるためのアプローチ」、包括的心理学、3:11.IT.3.1、doi:10.2466 / 11.IT.3.1
^ Dalgaard、Peter(2008)。Rを使用した入門統計。シュプリンガーサイエンス&ビジネスメディア。pp。99–100。ISBN 978-0-387-79053-4。
外部リンク
ウィルコクソンの符号付き順位検定(R)
ウィルコクソン符号順位検定の使用例
テストのオンラインバージョン
ウィルコクソン符号順位検定の臨界値の表
実験心理学者KarlL。Weunschによる簡単なガイド-ノンパラメトリック効果サイズ推定量(Copyright 2015 by Karl L. Weunsch)
カービー、DS(2014)。単純な差分式:ノンパラメトリック相関を教えるためのアプローチ。包括的な心理学、第3巻、記事1。doi:10.2466 /11.IT.3.1。記事へのリンク”