2021 Fiscal Year Annual Research Report
Algorithms that organisms search genes de novo
Project/Area Number |
18H03335
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
矢田 哲士 九州工業大学, 大学院情報工学研究院, 教授 (10322728)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 遺伝子のde novo誕生 / 生物の遺伝子探索アルゴリズム / バイオインフォマティクス解析 |
Outline of Annual Research Achievements |
(1)S. cerevisiaeのde novo遺伝子とそれらの近縁種での保存性、S. cerevisiaeと近縁種の系統樹とゲノム配列を用い、まず、各de novo遺伝子が生まれた系統樹の枝を同定し、次に、それらの各枝の上流と下流の節におけるペアの塩基配列を推定した。そして、各ペアの塩基配列を比べ、遺伝子がde novoに生まれる時期に観察される配列進化の統計的な特徴を調べることで、遺伝子のde novo誕生の過程(GCに富むゲノム領域に中立な突然変異が蓄積し、まずORFが伸長し、次に翻訳開始のシグナル配列が獲得される)を明らかにした。 (2)配列の短いものが多いde novo遺伝子は、遺伝子らしさを評価するのに十分な量の統計データをその配列からサンプルすることができないため、その発見は極めて難しい。そこで、従来から用いられているコドンの1文字目から始まる読み枠中のk-merの出現頻度に加え、コドンの2文字目や3文字目から始まるk-merの出現頻度を用いることを着想した。これにより、(k-1)-merの出現頻度を用いても、読み枠中のk-merの出現頻度を用いて到達することができる遺伝子発見精度を上回ることが確かめられた。 (3)遺伝子の構造にはイントロンレス構造とエキソン-イントロン構造があり、前者は後者のイントロン0個の場合である。今、イントロンレス構造の遺伝子をもつ生き物とエキソン-イントロン構造の遺伝子(イントロンレス遺伝子を含む)をもつ生き物に同じゲノム配列を与えると、後者のゲノム配列には前者より多くの候補遺伝子領域が存在し、後者のゲノムからは前者からより多くの遺伝子がde novoに生まれると考えられる。これまでに、遺伝子がイントロンに富むに従ってゲノム中の候補遺伝子数が指数的に増加すること、それに従って候補遺伝子長が伸長することが確かめられた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究実績の概要」に記したように、これまでに、(1)S. cerevisiaeに至る系統におけるde novo遺伝子の誕生過程を塩基配列の解像度で明らかにし、また、(2)lncRNAの塩基配列からde novo遺伝子を発見するコンピュータアルゴリズムを開発した。さらに、(3)イントロンが遺伝子のde novo誕生に果たす役割りを示唆するデータをゲノム配列のコンピュータ解析からえた。一方、「今後の研究の推進方策」に記したように、今後は、(1)と(2)の研究成果を論文にまとめて発表するとともに、(3)については、遺伝子構造へのイントロンの導入が遺伝子のde novo誕生に果たす役割りをコンピュータシミュレーションによって明らかにする。 以上より、本研究課題はおおむね順調に進展していると言える。
|
Strategy for Future Research Activity |
(1)S. cerevisiaeに至る系統におけるde novo遺伝子の誕生過程の解明については、研究成果を論文にまとめて発表する。 (2)lncRNAの塩基配列からde novo遺伝子を発見するコンピュータアルゴリズムの開発については、幾つかの項目についての検討を加えた後に研究成果を論文にまとめて発表する。具体的な検討項目として、新しいベンチマークデータの作成、翻訳開始シグナルと配列類似度を導入したde novo遺伝子の発見アルゴリズムの開発、オープンデータの解析を考えている。 (3)遺伝子構造へのイントロンの導入が遺伝子のde novo誕生に果たす役割りを遺伝的アルゴリズム(GA)に基づいたコンピュータシミュレーションによって明らかにする。このGAでは、任意の遺伝子配列を解として設定し、イントロンレス遺伝子をコードする染色体配列集団とエキソン-イントロン遺伝子(イントロンレス遺伝子を含む)をコードする染色体配列集団について、解の探索効率を比較する。後者の集団における解の探索効率が前者に比べて優れていれば、イントロンが遺伝子のde novo誕生を促進していると考えられる。
|
Research Products
(3 results)