C9orf50


C9orf50
第 9 染色体のオープンリーディングフレーム 50は、ヒトではC9orf50遺伝子によってコードされるタンパク質です。 C9orf50 には、もう 1 つの別名 FLJ35803 が知られています。ヒトでは、遺伝子コード配列は 10,051 塩基対の長さで、431 アミノ酸のタンパク質をコードする 1,624 塩基の mRNA を転写します。 C9orf50 識別子
エイリアス
C9orf50、染色体 9 オープンリーディングフレーム 50
外部 ID
MGI : 1923631 ホモ遺伝子: 18859 GeneCards : C9orf50
遺伝子の位置 (ヒト) Chr. 染色体 9 (人間)
バンド 9q34.11 始める
129,612,225 bp
終わり
129,620,776 bp
遺伝子位置 (マウス) Chr. 染色体 2 (マウス)
バンド 2|2B 始める
30,684,781 bp
終わり
30,693,673 bp
RNA発現パターン
ブジー
人間
マウス(オルソログ)
トップ表現
脛骨神経
子宮内膜の間質細胞
視床下部 扁桃体 尾状核
被殻
ブロッドマンエリア9
黒質
前頭前皮質
側坐核
トップ表現
精細管
精子細胞
精母細胞
モウラ
上前頭回
骨格筋組織
上腕三頭筋
大腿四頭筋 膝関節 腓腹筋
より多くの参照発現データ
バイオGPS
なし
オルソログ 種族 人間
ねずみ
エントレズ375759 73598
アンサンブルENSG00000179058 ENSMUSG00000044320
ユニプロットQ5SZB4 A2APZ1
RefSeq (mRNA)NM_199350 NM_198000
RefSeq (タンパク質)NP_955382 NP_932117
場所 (UCSC)
Chr 9: 129.61 – 129.62 Mb
Chr 2: 30.68 – 30.69 Mb
PubMed検索
ウィキデータ

人間の表示/
マウスの表示/編集

コンテンツ
1 遺伝子
1.1 位置
2 タンパク質
2.1 アイソフォーム
3 ドメイン
4 構成
5 三次構造
6 遺伝子レベルの調節
6.1 プロモーター 6.2 転写因子結合部位
7 成績証明書レベル規制
7.1 組織発現 7.2 細胞内発現
8 オルソログ
8.1 進化 8.2 アミノ酸保存
9 突然変異
10 参考文献
遺伝子編集

位置
ヒトでは、遺伝子はマイナス鎖の 9q34.11 に位置し、コード配列は 8,552 塩基対の長さです。ヒト染色体 9では、遺伝子は塩基chr9:132,374,504-132,383,055にまたがる C9orf50 の近くには、マイナス鎖の C9orf50 の直前の遺伝子であるASB6があり、プラス鎖にはNTMT1の 2 倍以上の大きさがあるC9orf50。

タンパク質
image"
  Dog2.0を使用したC9orf50の回路図。431 アミノ酸が表示され、黄色は無秩序領域、赤は高分子両性電解質、青緑色は DUF4685 を示しています。他のモチーフが表示され、正しい AA 位置にラベル付けされています。ピンクの円はアセチル化の部位を表し、青緑は糖化を表し、青はスモイル化を表します。
C9orf50 タンパク質の分子量は 47,639 kDで、予測される等電点は 10.38の 431アミノ酸で構成されています。このタンパク質は7つのエクソンから構成されています。

アイソフォーム
C9orf50 には 9 つの異なるスプライス アイソフォーム (SI) と 11 の異なる転写バリアント (TV) があり、最も一般的なのはアイソフォーム 1 と転写バリアント 1 です。
image
  C9orf50 アイソフォーム表。作者ハンナ・バーハウ
image
  C9orf50 アイソフォームと転写バリアント

ドメイン
タンパク質は、全体として分析することも、193 残基の N 末端ドメイン、103 残基の DUF4685、および 135 残基の C 末端ドメインを含む 3 つの部分に分割することもできます。完全なタンパク質 pI は、NTD、DUF4685、および CTD の平均 pI に類似しています。これらのセクションのうち、NTD は pI と mW が最も高いだけでなく、431 のうち 193 で最も多くの残基を持っています。 C9orf50 pI mW kD
残基
ヒト全タンパク質10.38 47.6 431 NTD 11.14
21.1193 DUF4685 10.8 11.8 103CTD 9.47 14.7
135

構成
C9orf50 タンパク質の組成分析により、ヒトと比較して I、M、Y、および FIKMNY の量が少なく、R、および KR-ED の量が多いことが明らかになりました。電荷クラスター、高スコアの荷電または非荷電セグメント、電荷ラン、パターン、高スコアの疎水性または膜貫通セグメントについての所見はありません。C の 3 つの異なる固有の間隔が 161、190、および 342 の位置に見られました。C9orf50 にも 3 つの反復構造があることがわかりました。最初の配列 PRLP_KLT は 30 位から始まり、78 位で繰り返されます。別の反復構造は SLLP です。 99 位と 398 位。250 位と 303 位の最後の反復構造は KAAL でできています。

三次構造
三次 C9orf50 タンパク質構造は、I-Tasserを使用して見つけることができます。このツールにより、5 つの構造が視覚化されます。C スコアが最も高い 2 つは -3.25 と -1.27 です。
遺伝子レベルの調節編集

プロモーター
C9orf50 のプロモーター領域は、Genomatix Gene2Promoter 検索エンジンを使用して見つかりました。これにより、6 つのプロモーター領域が見つかった。トランスクリプトとケージタグによってサポートされたのはそのうちの 2 つだけでした。最も支持されているプロモーター領域は 1,962 塩基にまたがり、945 個のケージタグを持つ 8 つのオーソログ遺伝子座のうち 6 つで保存されています。転写開始部位は、118個のケージタグでサポートされた7つのエクソンを持つ転写産物から1,503に位置すると決定されました。

転写因子結合部位
プロモーター領域に結合すると予測される転写因子は何百もプロモーター領域の転写因子の表は、これらのうちの 20 を強調しています。

成績証明書レベル規制
最高のデルタ G を持つ C9orf50 5′ UTR 分子間塩基対構造は、-323.4 kcal/mol です。これは、5’UTR 領域で予測される最低エネルギー構造です。 3′ UTR の場合、最高の dG は -127.5 kcal/mol であり、5′ UTR ほど安定していないことを示しています。
image
  C9orf50 3′ UTR ステムループ構造
image
  C9orf50 5′ UTR ステムループ構造

組織発現
C9orf50 のRNA-seqデータは、すべてのヒトタンパク質と比較して、ほとんどのヒト組織で 25 ~ 50 パーセンタイルという低い発現レベルを発見しました。ただし、精巣、脳、胆嚢で最も多く発現しています。 C9orf50 タンパク質の発現は、C9orf50 RNA の発現よりも高い。 in situ ハイブリダイゼーション データを研究する際、マウス C9orf50 オルソログ (シンボル 1700001O22Rik) を使用して、遍在的に発現するベータ アクチンに対するタンパク質発現を比較しました。分析では、マウス脳で同様の発現パターンが示されました。発達中、タンパク質は胎児期に見られます。

細胞内発現
このタンパク質は主に核に存在し、ミトコンドリアやサイトゾルにはあま​​り存在しません。
image
  C9orf50 プロモーター領域の転写因子

オルソログ
C9orf50の既知のパラログはありません。C9orf50 のオーソログは、 1 億 5900 万年前に枝分かれした亜綱有袋類の最も遠いオポッサムと共に、哺乳動物のほとんどのサブクラスにわたって保存されていることがわかっています。この遺伝子は、爬虫類、両生類、鳥類、または哺乳類より前に進化した他の生物には見られません。C9orf50が保存されている哺乳類の一覧を以下に示します。
C9orf50オルソログ
一般名
分類群
人間からの逸脱 (MYA)
NCBI登録番号
タンパク質の長さ (AA)
ヒトに対する配列同一性%
人間
ホミニニ 0 NP_955382.3431 100
チンパンジー
霊長類6.65 XP_016817319.1 431 97.22
ゴリラ
霊長類9.06 XP_018889539.1 435 93.17
ディアマウス
げっ歯類90 XP_006983488.1 391 46.14
草原のハタネズミ
げっ歯類90 XP_005346778.1 370 45.18
アメリカンピカ
ウサギ目90 XP_004593748.1 579 38.11
ナローリッジ スナメリ
鯨類96 XP_024617982.1 473 56.71
シャチ
鯨類96 XP_012388229.1 343 59.34
アルパカ
偶蹄目96 XP_006205645.1 399 53.83
ブラックフライングフォックス
翼手目96 XP_015449607.1 432 53.21
エジプトオオコウモリ
翼手目96 XP_015989428.1 431 53.01
ヤギ
偶蹄目96 XP_017910228.1 438 52.4
キタオットセイ
食肉目96 XP_025744313.1 441 52.36
ハイイログマ
食肉目96 XP_026369526.1 447 50.63
ヨーロッパハリネズミ
ソリコモファ96 XP_007527129.1 419 51.42
星鼻モグラ
テング目96 XP_012576659.1 383 48.68
南シロサイ
ペリソダクティラ96 XP_014637447.1 489 47.25
アフリカのブッシュゾウ
テング目105 XP_023401069.1 527 49.31
ナインバンドアルマジロ
シングラータ105 XP_023443586.1 476 46.72
灰色の短い尾のオポッサム
ディデルピモルフィア159 XP_007475193.1 583
32.56

進化
C9orf50 は、シトクロム C、ヘモグロビン ベータ、フィブリノーゲン アルファ鎖などの他の一般的なタンパク質よりも速く進化すると予測されています。
image
  C9orf50 分子時計

アミノ酸保存
重要なアミノ酸は、厳密なオルソログの複数配列アラインメントの MView で作成された 100% コンセンサス ライン上にあったものによって特徴付けられます。赤色のアミノ酸は、DUF4685 で保存されているアミノ酸を表します。22 の高度に保存されたアミノ酸のうち 14 がこのドメイン内に見られます。ロイシンは、C9orf50 タンパク質の最も保存された位置を占めています。
保存されたアミノ酸
C9orf50 AA 位置
プロリン 33,325 ロイシン
147、155、158、280、285、321、328 _ _
フェニルアラニン 231、275 アルギニン 272、286 バリン
273、313 _
アラニン 267 アスパラギン酸 277 グルタミン酸 278、289 トレオニン 279 チロシン 287 トリプトファン
288

突然変異
image
  C9orf50の翻訳後修飾と二次構造。Expasy Protein Modifications サイトに投稿されたツールを使用して、C9orf50 の PTM が見つかりました。C9orf50 の二次構造は、Gor、COILS、CFSSP、JPRED、および SOPMA からの分析を使用して予測されました。
、、、、緑色の円柱で示されるヘリックス、青色の矢印で示されるベータ シート、およびピンクの矢印で示されるターン構造は、以下の概念的な翻訳に含まれていました。予想スコアが高い。複数の分析ツールで見つかったすべての構造も保持されました。このタンパク質には膜貫通配列がありません。
C9orf50 の一般的なバリアントは、NCBI SNPGeneView で見つかりました。
dbSNP rs# クラスター ID
関数
dbSNP アレル
アミノ酸位置
rs146521610 V G 317 rs566893379 した 310 rs111868243 しあ258 rs918165
ミスセンス
かあ248 rs141573674
ミスセンス
しあ201 rs759058008
フレームシフト
削除されたL 189 rs111606531 あた86 rs146618124
ミスセンス
しし 52 rs372378735 ガア45 rs751493011
ナンセンス
T を挿入
11

参考文献
^ GRCh38: Ensembl リリース 89: ENSG00000179058 – Ensembl、2017 年 5 月 ^ GRCm38: Ensembl リリース 89: ENSMUSG00000044320 – Ensembl、2017 年 5 月 ^ 「ヒト PubMed リファレンス:」 . 国立バイオテクノロジー情報センター、米国国立医学図書館。
^「マウス PubMed リファレンス:」 . 国立バイオテクノロジー情報センター、米国国立医学図書館。
^「特徴付けられていないタンパク質 C9orf50 – タンパク質 – NCBI」 . www.ncbi.nlm.nih.gov . 2019-02-25取得。
^「遺伝子: C9orf50 (ENSG00000179058) – まとめ – ホモ・サピエンス – Ensembl ゲノムブラウザ 95」 . uswest.ensembl.org . 2019-02-25取得。
^ 「C9orf50遺伝子」 . www.genecards.org 。2019-02-25取得。
^「C9orf50 染色体 9 オープンリーディングフレーム 50 [ホモサピエンス (ヒト)] – 遺伝子 – NCBI」 . www.ncbi.nlm.nih.gov . 2019-02-25取得。
^ 「C9orf50 染色体 9 オープンリーディングフレーム 50 [ホモサピエンス (ヒト)] – 遺伝子 – NCBI」 . ^ 遺伝子https://www.ncbi.nlm.nih.gov/gene/375759
^ 「ExPASy – pI/Mw ツールの計算」 .
^ 「EBI ツール: ジョブが利用できません」 .
^ 「Genomatix: ログインページ」 .
^ 「Mfold Web サーバー | mfold.rit.albany.edu」 .
^ 「Gds3113 / 115495」 .
^ 「ウサギで産生された抗C9orf50抗体 Prestige Antibodies® Powered by Atlas Antibodies、アフィニティー分離抗体、緩衝グリセロール水溶液 | Sigma-Aldrich」 .
^ 「遺伝子の詳細 :: アレン脳アトラス: マウスの脳」 .
^ 「EST プロファイル – Hs.124223」 .
^ 「WoLF PSORT: 高度なタンパク質細胞内局在予測ツール – GenScript」 .
^ 「タンパク質 BLAST: タンパク質クエリを使用してタンパク質データベースを検索する」 . blast.ncbi.nlm.nih.gov . 2019-02-25取得。
^「EBI ツール: エラー」 .
^ 「コンティグ注釈を介して遺伝子 (geneID:375759) にリンクされた SNP」 .”