GC_skew
GCスキューとは、ヌクレオチドの グアニンとシトシンがDNAまたはRNAの特定の領域で過剰または不足している場合です。GCスキューは、鎖特異的なグアニンの過剰発現を測定するための統計的手法でも
GCスキューおよび累積GCスキュープロットでのDNA複製の起点と終点の表示。
リーディングストランドのTよりもGが豊富で、起点と終点にGCスキューサインが生じます。
平衡状態(突然変異または選択的圧力がなく、ヌクレオチドがゲノム内にランダムに分布している)では、DNA分子の両方の一本鎖に4つのDNA塩基(アデニン、グアニン、チミン、およびシトシン)の頻度が等しくなります。ただし、ほとんどの細菌(E. coliなど)および一部の古細菌(Sulfolobus solfataricusなど)では、ヌクレオチド組成はリーディング鎖とラギング鎖の間で非対称です。:リーディングストランドにはより多くのグアニン(G)とチミン(T)が含まれていますが、ラギングストランドにはより多くのアデニン(A)とシトシン(C)が含まれています。この現象はGCおよびATスキューと呼ばれ、対応する統計は次のように定義されています。
GCスキュー=(C-G)/(G + C)
ATスキュー=(A − T)/(A + T)
コンテンツ
1 非対称ヌクレオチド組成
2 計算とGCスキュープロット
2.1 GCの非対称性 2.2 CGCスキュー 2.3 Zカーブ
3 機構
4 用途
5 参考文献
非対称ヌクレオチド組成
1950年のErwinChargaffの研究は、DNAにおいて、塩基グアニンとシトシンが同じ量で発見され、塩基アデニンとチミンが同じ量で発見されたことを示しました。ただし、一方のペアの量ともう一方のペアの量の間に同等性はありませんでした。シャルガフの発見は、シャルガフの法則またはパリティ規則1と呼ばれます。 3年後、ワトソンとクリックは、二重らせんモデルであるDNAの構造を導出する際に、この事実を利用しました。
2つのDNA鎖のいずれにも突然変異および/または選択バイアスがない平衡状態でのパリティルール1の自然な結果は、等しい置換率がある場合、各鎖の相補的ヌクレオチドは次のようになります。与えられた塩基とその補体の等量。言い換えると、各DNA鎖では、置換率がおそらく等しいため、Tの発生頻度はAに等しく、Gの発生頻度はCに等しくなります。この現象は、パリティルール2と呼ばれます。したがって、2番目のパリティルールは、突然変異または置換がない場合にのみ存在します。
パリティルール2からの逸脱は、リーディングストランド(つまり、順方向に複製されるDNAストランド)をラギングストランドから区別する非対称の塩基組成をもたらします。この非対称性は、GCまたはATスキューと呼ばれます。
一部の細菌ゲノムでは、リーディング鎖ではシトシンよりもグアニンが、アデニンよりもチミンが濃縮されており、ラギング鎖ではその逆がヌクレオチド組成スキュースペクトルの範囲は、G=0またはA=0に対応する-1から、T=0またはC=0に対応する+1までです。したがって、正のGCスキューはCに対するGの豊富さを表します。負のGCスキューは、Gに対するCの豊富さを表します。その結果、先行ストランドで正のGCスキューと負のATスキューが見られ、後行ストランドで負のGCスキューと正のATスキューが見られると予想されます。 GCまたはATスキューは、DNA複製起点または終点に対応する2つの複製の境界で符号を変更します。 もともと、この非対称ヌクレオチド組成は、リーディング鎖とラギング鎖の間のDNA複製に使用される異なるメカニズムとして説明されていました。DNA複製は半保存的であり、それ自体が非対称のプロセスです。この非対称性は、複製フォークの形成と、その初期のリーディングストランドとラギングストランドへの分割によるものです。リーディングストランドは連続的に合成され、リーディングストランドと並置されます。遅れている鎖は、ポリヌクレオチドの短いフラグメント(岡崎フラグメント)を介して5’から3’の方向に複製されます。
計算とGCスキュープロット
GCスキューとそのプロパティを計算してグラフィカルに示すには、3つの主要なアプローチが
GCの非対称性
最初のアプローチは、GCとATの非対称性です。 Jean R. Lobryは、1996年に E. coli、Bacillus subtilis、およびHaemophilusinfluenzaeの3つの細菌のゲノムに組成の非対称性が存在することを最初に報告しました。当時の元の式はスキューとは呼ばれていませんでしたが、=または=からの偏差です。
からの偏差=as(A − T)/(A + T);
からの偏差=as(C − G)/(C + G);
ここで、A、T、G、およびCは、定義された長さの特定のシーケンスで同等の塩基が出現する頻度を表します。ウィンドウスライディング戦略は、Cからゲノム全体の偏差を計算するために使用されます。これらのプロットでは、Cからの正の偏差は遅れているストランドに対応し、Cからの負の偏差は先行しているストランドに対応します。さらに、偏差記号が切り替わる場所は、原点または終端に対応します。x軸は5’から3’にプロットされた染色体位置を表し、y軸は偏差値を表します。このメソッドの主な弱点は、ウィンドウサイズに依存するプロパティです。したがって、適切なウィンドウサイズを選択すると、プロットの結果に大きく影響します。DNA複製の起点をより正確に特定して特定するには、他の手法を偏差と組み合わせる必要が
CGCスキュー
49の細菌染色体の累積CGおよびATスキュー
2番目のアプローチは、累積GCスキュー(CGCスキュー)と呼ばれます。この方法は引き続きスライディングウィンドウ戦略を使用しますが、任意の開始から隣接するウィンドウの合計を利用します。このスキームでは、ゲノム全体が通常、任意の開始点と任意の鎖を使用して5’から3’にプロットされます。累積GCスキュープロットでは、ピークはスイッチポイント(終点または原点)に対応します。
Lobryの以前の論文とは対照的に、GCスキューの最近の実装では、元の定義が反転し、次のように再定義されています。
GCスキュー=(G − C)/(G + C)。
GCスキューの定義を反転すると、累積スキューの最大値は端末に対応し、最小値は複製起点に対応します。
Zカーブ
最後のアプローチはZカーブです。以前の方法とは異なり、この方法はスライディングウィンドウ戦略を使用せず、複製起点を見つけることに関してより優れたパフォーマンスを発揮すると考えられています。この方法では、シーケンスの開始時のベースに対する各ベースの累積度数が調査されます。Zカーブは、次のパラメータを使用した3次元表現を使用します。X n =(( A n + G n)。 − (( C n + T n)。
{ x_ {n} =(A_ {n} + G_ {n})-(C_ {n} + T_ {n})}
y n =(( A n + C n)。 − (( G n + T n)。
{ y_ {n} =(A_ {n} + C_ {n})-(G_ {n} + T_ {n})}
z n =(( A n + T n)。 − (( C n + G n)。
{ z_ {n} =(A_ {n} + T_ {n})-(C_ {n} + G_ {n})}
どこn =
0 1 2
、 。 N
{ n = 0,1,2、… N}
、X n { x_ {n}}
ピリミジンよりもプリンが過剰であることを表します。y n
{ y_ {n}}
アミノに対するケトの過剰を示し、z n
{ z_ {n}}
は、弱い水素結合と強い水素結合の関係を示しています。X
{ x}
と y { y}
コンポーネントだけで、複製起点とストランドの非対称組成を検出できます。これらの方法の組み合わせは、複製起点と終端の予測に使用して、それらの弱点を補う必要が
機構
各DNA鎖内のヌクレオチド組成の偏りの根底にあるメカニズムに関して、科学界ではコンセンサスが不足しています。細菌の鎖特異的ヌクレオチド組成の背後にあるメカニズムを説明する2つの主要な考え方が
最初のものは、複製と転写の間の各DNA鎖へのバイアスと非対称の突然変異圧力を説明します。 複製プロセスの非対称性により、複製プロセス中の不均等な突然変異頻度とDNA修復効率により、一方の鎖に他方の鎖と比較してより多くの突然変異が導入される可能性がさらに、2つのストランド間の複製に使用される時間はさまざまであり、先行ストランドと遅延ストランドの間で非対称の突然変異圧力が発生する可能性が DNA複製中の突然変異に加えて、転写突然変異は鎖特異的ヌクレオチド組成のゆがみを生み出す可能性が 1つのDNA鎖におけるシトシンの脱アミノ化、および最終的にはシトシンからチミンへの突然変異は、シトシンおよびアデニンに対するグアニンおよびチミンの相対数を増加させる可能性がほとんどの細菌では、遺伝子の大部分がリーディングストランドにコードされています。たとえば、枯草菌のリーディングストランドは遺伝子の75%をコードしています。さらに、非コード鎖と比較して、コード鎖での過剰な脱アミノ化およびシトシンからチミンへの変換が報告されています。 考えられる説明の1つは、転写されていない鎖(コード鎖)が転写プロセス中に一本鎖であるということです。したがって、転写された鎖(非コード鎖)と比較して、脱アミノ化に対してより脆弱です。 別の説明は、転写中の脱アミノ化修復活性はコード鎖では起こらないということです。これらの脱アミノ化修復イベントの恩恵を受けるのは転写された鎖だけです。
第2の考え方では、GCとATのスキューのメカニズムを、先行ストランドと遅延ストランドの間の選択圧の違いに起因すると説明しています。 原核生物のゲノムを調べると、CよりもG、AよりもTの3番目のコドン位置が優先されることが示されています。バクテリアの場合のように、先行および遅延ストランド。さらに、リボソームタンパク質などの高度に転写された遺伝子は、主に細菌の主要鎖に位置することが示されています。したがって、CよりもGの3番目の位置のコドン選択に偏りがあると、GCスキューが発生する可能性がさらに、 chi配列など、一部のシグナル配列はグアニンとチミンが豊富であり、これらの配列は、一方の鎖でもう一方の鎖と比較して発生頻度が高い可能性が
突然変異圧と選択圧の両方が、独立してDNA鎖に非対称性を導入する可能性がただし、両方のメカニズムの組み合わせと累積効果は、GCとATのスキューの最も妥当な説明です。
用途
GCスキューは、DNAリーディング鎖、ラギング鎖、複製起点、および複製末端の指標として有用であることが証明されています。 ほとんどの細菌と古細菌には、DNA複製起点が1つしか含まれ GCスキューは、先行ストランドと遅延ストランドでそれぞれ正と負です。したがって、DNA複製の起点と終点でGCスキューサインの切り替えが見られると予想されます。 GCスキューは、異なる環境での相補的塩基に対する1つの塩基の過剰を計算することにより、ストランドバイアスとそれらに関連するメカニズムを研究するためにも使用できます。 GCスキュー、CGCスキュー、Zカーブなどの方法は、さまざまな生物におけるDNA複製のメカニズムをよりよく調査する機会を提供できるツールです。
参考文献
^ ケネディ、ショーンP .; Ng、Wailap Victor; サルツバーグ、スティーブンL .; フード、リロイ; DasSarma、Shiladitya(2001-10-01)。「ゲノム配列の計算分析による極限環境へのハロバクテリウム種NRC-1の適応の理解」。ゲノム研究。11(10):1641–1650。土井:10.1101/gr.190201。ISSN1088-9051 。_ PMC311145 。_ PMID11591641 。_
^ i Lobry、JR細菌の2本のDNA鎖における非対称置換パターン。モレキュラーバイオロジーアンドエボリューション13、660-665(1996)。
^ Chargaff、E.核酸の化学的特異性とそれらの酵素分解のメカニズム。Experientia 6、201-209(1950)。
^ k l Necsulea、A.&Lobry、JRDNA塩基組成の非対称性に対する複製の影響を評価するための新しい方法。モレキュラーバイオロジーアンドエボリューション24、2169-2179、doi:10.1093 / molbev / msm148(2007)。
^ k l m n o Tillier、ER&Collins、RA細菌ゲノムの塩基組成の非対称性に対する複製方向、遺伝子方向、およびシグナル配列の寄与。Journal of Molecular Evolution 50、249-257(2000)。
^ Rocha、EP細菌ゲノムの複製関連組織。Microbiology 150、1609-1627、doi:10.1099 / mic.0.26974-0(2004)。
^ Lobry、JR(1996年5月)。「細菌の2本のDNA鎖における非対称置換パターン」。モレキュラーバイオロジーアンドエボリューション。13(5):660–665。土井:10.1093/oxfordjournals.molbev.a025626。ISSN0737-4038。_ PMID8676740。_
^ 「Lobry1996の記事の説明」
^ Grigoriev、A.累積スキュー図を使用したゲノムの分析。Nucleic Acids Research 26、2286-2290(1998)。
^ Zhang、R.&Zhang、CT古細菌Halobacterium種NRC-1の複数の複製起点。生化学的および生物物理学的研究コミュニケーション302、728-734(2003)。
^ Lobry、JR&Sueoka、N.バクテリアの非対称方向性突然変異圧力。ゲノム生物学3、RESEARCH0058(2002)。
^ Eppinger、M.、Baar、C.、Raddatz、G.、Huson、DH&Schuster、SC4つのカンピロバクターの比較分析。ネイチャーレビュー。微生物学2、872-885、doi:10.1038 / nrmicro1024(2004)。
^ Marin、A.&Xia、X.細菌ゲノムのリーディング鎖とラギング鎖の間のタンパク質コーディング遺伝子のGCスキュー:鎖バイアスを組み込んだ新しい置換モデル。理論生物学ジャーナル253、508-513、doi:10.1016 / j.jtbi.2008.04.004(2008)。
^ Charneski CA、Honti F.、Bryant JM、Hurst LD、Feil EJ Firmicuteゲノムの非定型ATスキューは、突然変異ではなく選択の結果です。PLoS Genetics 7(9):e1002283(2011)。
Mewes、HWetal。MIPS:2005年の全ゲノムからのタンパク質の分析と注釈。NucleicAcidsRes 34、D169-172、doi:10.1093 / nar / gkj148(2006)。”