DeMix


DeMix

DeMixは、混合癌トランスクリプトームをデコンボリューションして、線形混合モデルを使用して腫瘍および間質細胞サンプルの可能性のある割合を予測するための統計的手法です。それはアンらによって開発されました。
Demixは、4つの可能なシナリオを明示的に考慮します。参照遺伝子なしで、一致した腫瘍と正常なサンプル。参照遺伝子を含む、比類のない腫瘍および正常サンプル。参照遺伝子のない、比類のない腫瘍および正常サンプル。
参照遺伝子は、すべての構成組織タイプの外部データに基づいて発現プロファイルが正確に推定された遺伝子のセットです。

コンテンツ
1 序章
2 方法
3 使用法
4 参考文献

序章
臨床診療から得られた固形腫瘍サンプルは非常に不均一です。それらは、癌細胞の複数のクローン集団、ならびに隣接する正常組織、間質細胞、および浸潤性免疫細胞からなる。腫瘍組織の非常に不均一な構造は、さまざまなゲノムデータ分析を複雑にしたり、偏らせたりする可能性がインシリコで混合サンプルから発現データを分離するには、不均一性を取り除くことが非常に重要です。
分析の前に、腫瘍の純度、または腫瘍サンプル中の癌細胞の割合を推定して説明することが重要です。癌細胞と正常細胞の顕著な違いにより、ハイスループットのゲノムまたはエピゲノムデータから腫瘍の純度を推定することが可能です。
DeMixは、混合サンプル中の癌細胞からの割合と遺伝子発現プロファイルを推定します。この方法では、混合サンプルは、癌細胞(既知の事前遺伝子発現プロファイルなし)と正常細胞(腫瘍一致または不一致サンプルのいずれかから得られる既知の遺伝子発現データを含む)の2つの細胞タイプのみで構成されると想定されます。 )。
DeMixはマイクロアレイデータ用に開発されており、他のほとんどの方法のように対数変換されたデータを処理するのではなく、マイクロアレイの場合のように対数正規分布に従うと仮定して、生データを入力として使用することが重要であることを示しています。DeMixは、正常なサンプルの遺伝子発現の分散を推定し、これを最尤推定で使用して、各遺伝子の遺伝子固有の重みを暗黙的に使用して、癌細胞の遺伝子発現と比率を予測します。
DeMixは、データが対数変換される前に、データの遺伝子発現レベルの線形混合を追跡する最初の方法です。この方法は、データが対数変換される前に異種腫瘍サンプルからのデータを分析し、各サンプルおよび比類のないデザインの各遺伝子の個々のレベルの発現レベルを推定します。

方法
させてI g L N(( μ N g σ N g
2)。
{ N_ {ig} sim LN( mu _ {N_ {g}}、 sigma _ {N_ {g}} ^ {2})}

  とI g L N(( μ T g σ T g
2)。
{ T_ {ig} sim LN( mu _ {T_ {g}}、 sigma _ {T_ {g}} ^ {2})}

  遺伝子gとサンプルの発現レベル I { i}

 それぞれ純粋な正常組織と腫瘍組織から。LNはl o g 2
{ log_ {2}}

  正規分布。いつl o g 2
{ log_ {2}}

 通常の仮定に違反しているため、精度の低下が予想されます。腫瘍組織からの発現レベルT I g
{ T_ {ig}}

 観察されません。させてY I g
{ Y_ {ig}}

 観察された臨床的に得られた腫瘍サンプルの発現レベルを示します。させてπ I
{ pi _ {i}}

 、不明、サンプル中の腫瘍組織の割合を示します I { i}

 。生の測定データは、次のように線形方程式として書き込まれます。Y I g = π
IT I g +(( 1− π I )。N I g
{ Y_ {ig} = pi _ {i} T_ {ig} +(1- pi _ {i})N_ {ig}}
  ご了承ください YI g { Y_ {ig}}

  従わないl o g 2
{ log_ {2}}

  両方の場合の正規分布 NI g { N_ {ig}}

  と TI g { T_ {ig}}

  フォローするl o g 2
{ log_ {2}}

  正規分布。
DeMixメソッドには主に2つのステップが
ステップ1:与えられた Y { Y}

 との分布 N { N}

 の、観察の可能性 Y { Y}

  検索するために最大化されます {{ π μ
T σ T2 { { pi、 mu _ {T}、 sigma _ {T} ^ {2} }}

 。
ステップ2:与えられた π { pi}

 との分布 T { T}

 と ′ s { N’s}

 、の個々のペア(( T N )。 {(T、N)}

  各サンプルおよび各遺伝子について推定されます。
これらの手順は、特定のデータシナリオに適合します。
DeMixは、結合密度の数値積分を含むネルダーミード最適化手順を使用して開発されました。DeMixは、最初に推定することによって2段階のアプローチを取りますπ I
{ pi _ {i}}

 s次に、に基づいて遺伝子発現の平均と分散を推定します。π ^ I
{ { hat { pi}} _ {i}}

 s。すべてのパラメータを同時に推定する共同モデルは、組織の比率の不確実性の尺度をさらに組み込むことができます。ただし、このようなモデルからの推定ステップは計算量が多く、高スループットデータの分析には適さない場合が

使用法
DeMixは、参照遺伝子の有無と一致または不一致の設計という4つのデータシナリオに対応しています。アルゴリズムでは、参照遺伝子として少なくとも1つの遺伝子が必要ですが、外れ値からの潜在的な影響を軽減し、次の最適なセットを特定するために、少なくとも5〜10個の遺伝子を使用することをお勧めします。 π { pi}

 s。DeMixは、混合サンプルが最大2つの細胞内コンパートメント(正常細胞と腫瘍)で構成されており、正常細胞の分布パラメーターは他の利用可能なデータから推定できると想定しています。他の状況では、より複雑なモデリング 参考文献

^ Yadav、VK、​​およびS.De。「異種腫瘍組織サンプルから得られたゲノムデータを使用して純度とクローン性を推定するための計算方法の評価。」バイオインフォマティクスのブリーフィング、vol。16、いいえ。2、2014、pp。232–241。、 doi: 10.1093 / bib / bbu002。
^ Oonk、HAJ(2012-12-02)。フェーズ理論。エルゼビア。ISBN 978-0-444-59933-9。
^ アン、ジェイル、他。「DeMix:生の測定データを使用した混合がんトランスクリプトームのデコンボリューション。」バイオインフォマティクス、vol。29、いいえ。15、2013、pp。1865–1871。 、 doi: 10.1093 / bioinformatics / btt301。
^ Racle、Julien; de Jonge、Kaat; Baumgaertner、Petra; Speiser、Daniel E; グフェラー、デビッド(2017-11-13)。「バルク腫瘍遺伝子発現データからの癌と免疫細胞型の同時列挙」。eLife。eLife Sciences Publications、Ltd.6。bioRxiv 10.1101 / 117788。土井:10.7554 /elife.26476。ISSN2050-084X。_ PMC5718706。_ PMID29130882。_
    
^ Wang、Fayou、etal。「癌エピゲノミクスにおける腫瘍純度とメチル化の差異。」機能ゲノミクスのブリーフィング、2016年、 doi: 10.1093 / bfgp / elw016。”