2017 Fiscal Year Research-status Report
ゲノムアノテーションで見過された短鎖ペプチドコードORFの発見と疾患マーカー開発
Project/Area Number |
17K19565
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
矢田 哲士 九州工業大学, 大学院情報工学研究院, 教授 (10322728)
|
Co-Investigator(Kenkyū-buntansha) |
秋光 信佳 東京大学, アイソトープ総合センター, 教授 (40294962)
|
Project Period (FY) |
2017-06-30 – 2019-03-31
|
Keywords | ショートORF(sORF) / 短鎖ペプチド / ノンコーディングRNA(ncRNA) / ヒトゲノム / 疾患マーカー |
Outline of Annual Research Achievements |
ヒトゲノムでは、タンパク質コード遺伝子を上回る数のノンコーディングRNA(ncRNA)遺伝子が同定されているが、その多くの機能は分かっていない。しかし、幾つかのncRNAは、特定の疾患組織で過剰に発現することから、疾患マーカーとして利用されている。一方、ncRNAだと考えられていた遺伝子が短いペプチドをコードしている例が報告されている。本研究課題では、ヒトの全ncRNA中に短鎖ペプチドをコードするショートORF(sORF)を網羅的に発見し、それら由来のペプチドの検出とそれらの機能解析により、新しいペプチド疾患マーカーの開発を目指す。ペプチドマーカーは、RNAマーカーに比べ、血中での安定性が高く、また、臨床現場への導入も容易であることから、その開発が渇望されている。
ここでは、実験的アプローチと計算的アプローチを有機的に連携させて研究を進めている。今年度は、まず、実験的アプローチにより、ヒトの7,841個のlincRNA(long intergenic noncoding RNA)遺伝子について、(1)リボソームプロファイリングで翻訳が示され、かつ、(2)UPF1ノックダウンRNA-seqで非NMD(nonsense-mediated decay)ターゲットであることが示された139個の遺伝子を同定した。次に、計算的アプローチにより、これらの遺伝子中のORFの全てを列挙し、そのコーディングポテンシャルを、ヒトの全タンパク質コード遺伝子から取得したコドンの使用頻度統計に基づいて評価したところ、統計的に有意なORFを見つけることはできなかった。このことは、短鎖ペプチドをコードするsORFのコドンの使用頻度が、これまでに知られているタンパク質コード遺伝子のそれとは異なっていることを示している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
実験的アプローチでは、短鎖ペプチドをコードしていると考えられるsORFをヒトlincRNA中に同定することができた。今後は、これらのsORFに由来するペプチドを検出し、それらの生理学的な機能を明らかにする。
計算的アプローチでは、これまでに報告されているヒトのタンパク質コード遺伝子のコドンの使用頻度統計では、短鎖ペプチドのコーディング性を評価できないことが明らかになった。ただし、これは想定していたことなので、今後は、直接、短鎖ペプチドをコードしているsORFからコドンの使用頻度統計を取得することを試みる(下記)。
|
Strategy for Future Research Activity |
実験的アプローチでは、上記の139個の遺伝子について、さらに、ポリソームプロファイリングでも翻訳が示され、かつ、核分画と細胞質分画のRNA-seqで細胞質局在が示された遺伝子を同定し、それらについての機能解析を進める。例えば、sORFの破壊時に観察される遺伝子発現プロファイルの変化、細胞増殖能や運動能や細胞接着能などの表現型レベルの変化を調べる。また、短鎖ペプチドと相互作用するタンパク質を同定し、そのタンパク質の機能から短鎖ペプチドの生理学的な機能を推定する。
計算的アプローチでは、まず、この139個の遺伝子から短鎖ペプチドをコードするsORFのコドンの使用頻度統計を取得する。そこで、これらの遺伝子中の全てのORFを列挙し、それらの種間保存度やKs/Kn値などを組み合せることで、各遺伝子の中で最も短鎖ペプチドをコードしていると考えられるsORFを同定し、同定されたsORFからコドンの使用頻度統計を取得する。そして、このコドンの使用頻度統計を用いてヒトの全lincRNAのORFを再評価し、短鎖ペプチドをコードするsORFの存在が示唆されたlincRNAについては、実験的アプローチによる検証を試みる。
さらに、実験的アプローチによって検出された短鎖ペプチドをコードするsORFについて、計算的アプローチによる機能解析を進める。例えば、それらのsORFが属する遺伝子のプロモーターに観察される転写因子結合部位の構成を同定し、それと似た構成のプロモーターを持つタンパク質コード遺伝子をヒトゲノム中に探索する。それらのプロモーターは、似た転写調節を受けていると考えられるので、それらの遺伝子は似た機能を示す可能性が高い。そこで、探索されたプロモーターの遺伝子のオントロジー解析やパスウェイデータへのマッピングなどを行ない、短鎖ペプチドの生理学的な機能を推定する。
|
Causes of Carryover |
解析データのストレージとして導入を計画していた外付けSSDとそれを接続するために導入を計画していたLinux PCの納入が次年度の5月になることが分かり、本年度の導入を見送ったため。外付けSDDとLinux PCは、次年度早々に導入する計画である。
|