ブロッキング(統計)


Blocking_(statistics)

で、統計の理論、実験の設計、ブロッキングがで配置され、実験台互いに類似しているグループの(ブロック)。

コンテンツ
1 使用する
1.1 例
2 ランダム化されたブロックデザイン
2.1 制御可能な妨害要因に使用されるブロッキング 2.2 ブロッキングファクターの定義 2.3 最も重要な妨害要因のいくつかをブロックします 2.4 テーブル 2.5 例
2.5.1 実験の説明
2.5.2 行列表現
2.62.6 モデル 2.7 見積り 2.8 一般化
3 理論的根拠
4 も参照してください
5 参考文献
6 参考文献

使用する
ブロッキングにより、原因不明の変動が減少します。その原理は、克服できない変動性(たとえば、化学物質の1つのコンテナを生成するために2つのバッチの原材料が必要)が、(n)(高次/高次)相互作用と交絡またはエイリアス化されて、最終製品。通常、高次の相互作用は最も重要ではありません(リアクターまたは原材料のバッチの温度は、2つの組み合わせよりも重要であるという事実を考えてこれは、より多くの場合に特に当てはまります(3、4、…)要因が存在します); したがって、この変動性をより高い相互作用と混同することが好ましい。


男性と女性:実験は、患者に新薬をテストするように設計されています。二重盲検試験で男性と女性の患者に投与される治療には、薬物とプラセボの2つのレベルが患者の性別は、男性と女性の間の治療のばらつきを説明する阻害要因です。これにより、変動の原因が減少し、精度が向上します。
標高:実験は、草の特定のパッチに対する新しい農薬の影響をテストするように設計されています。草地には大きな標高の変化が含まれているため、「高標高」と「低標高」の2つの異なる領域で構成されます。処理グループ(新しい農薬)とプラセボグループは、草の高地と低地の両方に適用されます。この例では、研究者は農薬の使用における変動性を説明するかもしれない上昇係数をブロックしています。
介入:靴の裏を長持ちさせるプロセスが発明され、フィールドトライアルを実施する計画が立てられたとします。n人のボランティアのグループを考えると、1つの可能な設計は、2種類の靴底の割り当てをランダム化して、n / 2の靴に新しい靴底を、n / 2の靴に通常の靴底を与えることです。このタイプの実験は、完全にランダム化された設計です。次に、両方のグループが一定期間靴を使用してから、靴底の摩耗の程度を測定するように求められます。これは実行可能な実験計画ですが、純粋に統計的精度の観点から(他の要因を無視して)、より良い設計は、各人に1つの通常の靴底と1つの新しい靴底を与え、2つのタイプを左側にランダムに割り当てて各ボランティアの右の靴。このようなデザインは「ランダム化された完全なブロックデザイン」と呼ばれます。この設計は、各人が自分のコントロールとして機能し、したがってコントロールグループが治療グループにより密接に一致するため、最初のデザインよりも感度が高くなります。

ランダム化されたブロックデザイン
で、統計の理論、実験の設計、ブロッキングがで配置され、実験台互いに類似しているグループの(ブロック)。通常、ブロッキングファクターは変動の原因であり、実験者にとっては主な関心事ではありません。ブロッキング要因の例は、患者の性別です。性別をブロックすることにより、この変動の原因が制御され、精度が向上します。
確率論では、ブロック法は、サンプルを小さなサブブロックで区切られたブロック(グループ)に分割することで構成されているため、ブロックはほぼ独立していると見なすことができます。ブロック法は、従属確率変数の場合に極限定理を証明するのに役立ちます。
ブロック方法は、によって導入されたS.バーンスタイン:の方法が正常に従属確率変数の和の理論およびに適用された極値理論。

制御可能な妨害要因に使用されるブロッキング
妨害要因を制御できる場合、ブロッキングと呼ばれる重要な手法を使用して、妨害要因による実験誤差への寄与を低減または排除できます。基本的な概念は、妨害要因が一定に保たれ、関心のある要因が変化することを許可された均質なブロックを作成することです。ブロック内では、分析で考慮されるブロック要因の変化による変動を心配することなく、関心のある要因のさまざまなレベルの影響を評価することができます。

ブロッキングファクターの定義
主要要因のすべてのレベルが迷惑要因の各レベルで同じ回数発生する場合、迷惑要因がブロッキング要因として使用されます。実験の分析は、実験の各ブロック内の主要な要因のさまざまなレベルの影響に焦点を当てます。

最も重要な妨害要因のいくつかをブロックします
一般的なルールは次のとおりです。
「できることをブロックします。できないことをランダム化します。」
ブロッキングは、いくつかの最も重要な迷惑変数の影響を取り除くために使用されます。次に、ランダム化を使用して、残りの迷惑変数の汚染効果を減らします。重要な迷惑変数の場合、ブロックすると、ランダム化よりも対象の変数の重要性が高くなります。

テーブル
ランダム化されたブロック実験を見る1つの便利な方法は、完全にランダム化された実験のコレクションと見なすことです。各実験は、実験全体のブロックの1つ内で実行されます。
ランダム化ブロックデザイン(RBD)
デザイン名 因子の数k 実行数n
2要素RBD 2 L 1 * L 2
3ファクターRBD 3 L 1 * L 2 * L 3
4因子RBD 4 L 1 * L 2 * L 3 * L 4 ⋮ { vdots}
  ⋮ { vdots}
  ⋮ { vdots}
 
kファクターRBD
k L 1 * L 2 * ⋯ { cdots}
 * L kと L
1 =ファクター1のレベル(設定)の数 L 2 =ファクター2のレベル(設定)の数 L 3 =ファクター3のレベル(設定)の数 L 4 =ファクター4のレベル(設定)の数 ⋮ { vdots}
 
L k =因子kのレベル(設定)の


半導体製造施設のエンジニアが、さまざまなウェーハ注入材料の投与量が、炉内で拡散プロセスが行われた後の抵抗率測定に大きな影響を与えるかどうかをテストしたいとします。彼らは試したい4つの異なる投与量と、同じロットからの十分な実験用ウェーハを持っており、それぞれの投与量で3枚のウェーハを実行します。
彼らが懸念している厄介な要因は「炉の運転」です。これは、各炉の運転が最後の炉の運転とは異なり、多くのプロセスパラメータに影響を与えることが知られているためです。
この実験を実行する理想的な方法は、すべての4×3 = 12ウェーハを同じ炉で実行することです。それは厄介な炉の要因を完全に排除するでしょう。ただし、通常の生産ウェーハには炉の優先順位があり、同時に稼働する炉には数枚の実験ウェーハしか使用できません。
この実験を実行するためのブロックされていない方法は、12個の実験ウェーハのそれぞれをランダムな順序で、炉の実行ごとに1つずつ実行することです。それは、実行ごとの炉の変動性による各抵抗率測定の実験誤差を増加させ、異なる投与量の影響を研究することをより困難にするでしょう。この実験を実行するためのブロックされた方法は、4つの実験用ウェーハを炉の運転に入れるように製造を説得できると仮定すると、3つの炉の運転のそれぞれに異なる投与量の4つのウェーハを入れることです。唯一のランダム化は、投与量1の3つのウェーハのどれを炉の運転1に入れるかを選択することであり、同様に、投与量2、3、および4のウェーハについても同様です。

実験の説明
レッツX 1回の、BEの投与量「レベル」とX 2は、実行炉のブロッキング要因です。次に、実験は次のように説明できます。
K = 2つの要素(1つの要因 X 1及び1ブロッキング因子 ) L 1因子の= 4レベル L 2因子の= 3レベル
n = 1セルあたり1回の複製
N = L 1 * L 2 = 4 * 3 = 12ラン
ランダム化前の設計試行は次のようになります。 X 1 X 2 1 1 1 2 1 3 2 1 2 22 3 3 1 3 2 3 3 4 1 4 2
4 3

行列表現
設計試験を要約する別の方法は、その4行治療のレベルである4×3の行列を使用することであろうX 1列ブロック変数の3つのレベルであり、X 2。マトリックス中の細胞は一致指数有し、X 1、X 2つの組み合わせ上記。
処理 ブロック1 ブロック2 ブロック3
1 1 1 1
2 1 1 1
3 1 1 1
4 1 1 1
ひいては、K因子のランダム化ブロック設計の試行は、単にk次元行列のセルインデックスであることに注意して

モデル
1つの迷惑変数を持つランダム化ブロックデザインのモデルは次のとおりです。 Y I = μ + 私+ +o e o {Y_ {ij} = mu + T_ {i} + B_ {j} + mathrm {ランダムエラー}}
  どこ Y ijはのための任意の観察である X 1 =
I且つ X 2 =J X
1が主要な要因であります X 2は、ブロッキング因子であります
μは一般的な位置パラメータ(つまり、平均)です。 T iは、(ファクター
X 1の)
治療iにあることによる効果です。 B jは、(係数
X 2の)
ブロックjにあるための効果です。

見積り
μの見積もり:
Y ¯ {{ overline {Y}}}

  =すべてのデータの平均 T iの
見積もり : Y ¯ I ⋅ − Y ¯ {{ overline {Y}} _ {i cdot}-{ overline {Y}}}

  とY ¯ I ⋅
{{ overline {Y}} _ {i cdot}}

 = X 1 =
iである
すべてのYの平均 B jの 見積もり: Y ¯
⋅ −Y ¯
{{ overline {Y}} _ { cdot j}-{ overline {Y}}}

  とY ¯
⋅ {{ overline {Y}} _ { cdot j}}

 = X 2 =
jである

すべてのYの平均 一般化
一般化ランダム化ブロック設計(GRBD)は、ブロックと処理の交互作用のテストを可能にし、RCBDのように1つのブロッキング係数を持っています。
ラテン方格(およびその他の行と列のデザイン)には、相互作用がないと考えられる2つのブロッキング要因が
ラテン超立方体サンプリング
Graeco-ラテン方格
Hyper-Graeco-ラテン方格のデザイン

理論的根拠
ブロッキングの理論的根拠は、次の数学的結果です。与えられた確率変数、XとY Var (( − Y )。= Var(( )。+ Var(( Y
)。− 2 Cov(( 、 Y )。 { operatorname {Var}(XY)= operatorname {Var}(X)+ operatorname {Var}(Y)-2 operatorname {Cov}(X、Y)}
  したがって、XとYの間の共分散(または相関)を最大化することにより、処理とコントロールの差に最小分散(つまり最大精度)を与えることができます。

も参照してください
icon
 数学ポータル
代数統計
ブロックデザイン
組み合わせデザイン
一般化されたランダム化されたブロック設計
実験計画の用語集
最適な設計
対の差検定
ランダム化されたブロックデザイン
従属変数と独立変数
ブロックモデリング

参考文献
^ Bernstein SN(1926)Surl’extensionduthéorèmelimiteducalculdesprobabilitésauxsommesdequantitésdépendantes。算数。アナレン、v。97、1-59。
^ IbragimovIAおよびLinnikYu.V。(1971)確率変数の独立した定常シーケンス。Wolters-Noordhoff、フローニンゲン。
^ Leadbetter MR、Lindgren G.およびRootzénH。(1983)ランダムシーケンスおよびプロセスの極値および関連プロパティ。ニューヨーク:SpringerVerlag。
^ Novak SY(2011)財務への応用を伴う極値法。チャップマン&ホール/ CRCプレス、ロンドン。
Public Domain
  には、米国国立標準技術研究所のWebサイトhttps://www.nist.govからのパブリックドメインの資料が組み込まれてい ます。

参考文献
アデルマン、S。(1969)。「一般化されたランダム化されたブロック設計」。アメリカの統計学者。23(4):35–36。土井:10.2307 / 2681737。JSTOR  2681737。
アデルマン、S。(1970)。「実験の設計と分析における処理と実験単位の変動性」。アメリカ統計協会誌。65(331):1095–1108。土井:10.2307 / 2284277。JSTOR  2284277。
アンスコム、FJ(1948年)。「比較実験の妥当性」。王立統計学会誌。A(一般)。111(3):181–211。土井:10.2307 / 2984159。JSTOR  2984159。MR  0030181。
ベイリー、R。A(2008)。比較実験の設計。ケンブリッジ大学出版局。ISBN 978-0-521-68357-9。 出版前の章はオンラインで入手できます。
バパット、RB(2000)。線形代数と線形モデル(第2版)。スプリンガー。ISBN 978-0-387-98871-9。
CalińskiT。&Kageyama S.(2000)ブロックデザイン:ランダム化アプローチ、ボリュームI:分析。統計学の講義ノート。150。ニューヨーク:Springer-Verlag。ISBN 0-387-98578-6。
CalińskiT。&Kageyama S.(2003)ブロックデザイン:ランダム化アプローチ、ボリュームII:デザイン。統計学の講義ノート。170。ニューヨーク:Springer-Verlag。ISBN 0-387-95470-8。MR  1994124。
ゲイツ、CE(1995年11月)。「ブロックデザインの実験誤差は本当に何ですか?」アメリカの統計学者。49(4):362–363。土井:10.2307 / 2684574。JSTOR  2684574。
ケンプソーン、オスカー(1979)。実験の設計と分析((1952)Wiley編の修正された再版)。ロバートE.クリーガー。ISBN 0-88275-105-0。
ヒンケルマン、クラウスとケンプソーン、オスカー(2008)。実験の設計と分析。IおよびII(第2版)。ワイリー。ISBN 978-0-470-38551-7。
ヒンケルマン、クラウスとケンプソーン、オスカー(2008)。実験計画法、第1巻:実験計画法入門(第2版)。ワイリー。ISBN 978-0-471-72756-9。
ヒンケルマン、クラウスとケンプソーン、オスカー(2005)。実験計画法、第2巻:高度な実験計画法(初版)。ワイリー。ISBN 978-0-471-55177-5。
レントナー、マーヴィン; トーマスビショップ(1993)。「一般化されたRCB設計(第6.13章)」。実験計画と分析(第2版)。私書箱884、バージニア州ブラックスバーグ24063:バレーブックカンパニー。pp。225–226。ISBN 0-9616255-2-X。
Raghavarao、Damaraju(1988)。実験計画法における構造と組み合わせ問題(1971年のWiley編の修正された再版)。ニューヨーク:ドーバー。ISBN 0-486-65685-3。
Raghavarao、Damaraju and Padgett、LV(2005)。ブロックデザイン:分析、組み合わせ論およびアプリケーション。世界科学。ISBN 981-256-360-1。
Shah、Kirti R.&Sinha、Bikas K.(1989)。最適設計の理論。統計の講義ノート。54。Springer-Verlag。pp。171+ viii。ISBN 0-387-96991-8。
ストリート、アンペンフォールド; ストリート、デボラJ.(1987)。実験計画の組み合わせ論。オックスフォードUP 。ISBN 0-19-853256-3。
ウィルク、MB(1955)。「一般化されたランダム化ブロック設計のランダム化分析」。バイオメトリカ。42(1–2):70–79。土井:10.2307 / 2333423。JSTOR  2333423。
ジスキンド、ジョージ(1963年)。「バランスの取れた不完全なブロックデザインの一般化におけるランダム化のいくつかの結果」。数学的統計の年報。34(4):1569–1581。土井:10.1214 / aoms / 1177703889。JSTOR  2238364。”