研究課題
配列相同性検索はゲノム解読がなされた際の遺伝子機能を推定する技術として普及したが、この方法で機能が推定できるタンパク質遺伝子は半数程度にとどまる。我々がゲノム配列の解析用に開発した一括学習型のSOM(BL-SOM)を、オリゴペプチドの使用頻度に適用したところ、タンパク質が機能により分離(自己組織化)する傾向を示した。相同性検索に依存しないタンパク質の機能推定法として確立できる可能性が考えられた。本年度は2〜4連アミノ酸の頻度パターンの類似度を基礎にした機能推定法を開発した。多次元ベクトル空間の大量情報解析であり高性能なスーパーコンピュータの使用が重要となる。機能既知の約11万件のタンパク質を対象に、2〜4連アミノ酸に着目したBL-SOMを地球シミュレータで作成した。20のアミノ酸を物理化学的な性質の類似度で、11または6のカテゴリーヘグループ化1した条件検討を行ない、さらに、200アミノ酸のwindowを設けて50アミノ酸のstepで移動させることで、通常の大きさのタンパク質と大型タンパク質とを同時に解析可能にした。サルガッソ海由来試料のメタゲノム解析で得られている機能未知のタンパク質遺伝子候補配列にBL-SOM解析を適用したところ、約10万件の遺伝子候補配列について、上記の異なったBL-SOM条件を用いても同様な機能が推定できた。これらの多重判定で得られた推定結果は信頼性の高い結果と思われる。成果はSOMの国際学会(フロリダ)での発表が決定している。その発表論文がSpringer社から公開後に、機能推定の結果をWebで公開する予定である。産業的に有用な遺伝子が存在するので企業からの公開の交渉も進行している。メタゲノム解析で得られた有用遺伝子の由来生物の推定に、同一クローン上に見出されるtRNA遺伝子配列が良いマーカーになることも見出したので、あわせて公開を行う。
すべて 2009 2008 その他
すべて 雑誌論文 (8件) (うち査読あり 4件) 学会発表 (8件) 備考 (2件)
Proceedings of Workshop 2009 on Self-Organizing Maps accepted
Proceedings of the 10th International Work Conference on Artificial Neural Networks accepted
Nucleic Acids Research Vol. 37, Databaseissue
ページ: D163-D168
Genome Res 18(3)
ページ: 442-448
日本化学会情報化学部会誌 Vol. 26
ページ: 40-44
ページ: 31-33
ページ: 20-22
ページ: 17-19
http://dbcls.nagahama-i-bio.ac.jp/
http://trna.nagahama-i-bio.ac.jp/cgi-bin/trnadb/index.cgi