研究課題/領域番号 |
16K00392
|
研究機関 | 松江工業高等専門学校 |
研究代表者 |
林田 守広 松江工業高等専門学校, 電気情報工学科, 准教授 (40402929)
|
研究分担者 |
小谷野 仁 東京工業大学, 生命理工学院, 特任助教 (10570989)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | タンパク質ドメイン / 文法圧縮 / ニューラルネットワーク / タンパク質RNA相互作用 |
研究実績の概要 |
タンパク質の部分構造であるドメインに注目し一つの生物種におけるタンパク質全体についてドメイン構成の進化的側面から解析を行った.そのためにこれまで開発してきたドメイン集合の族に対する文法に基づく圧縮手法を修正し,ドメインのタンパク質内での順序の付いた列の集合に対する文法を新しく定義した.文法規則としては進化の過程における突然変異および遺伝子重複を仮定し,遺伝子が複製される際にはドメインが挿入または削除されるとした.ドメインの順序を考える上では,複製元のタンパク質のドメイン列から複製後のドメイン列への変換を考え,ドメインの挿入によるレーベンシュタイン距離に基づいたコストを定義した.一つの生物種に含まれるタンパク質全体を構成するすべての生成規則の中から最小コストの文法を見つける問題は最小全域木問題に帰着され大域最適解を多項式時間で見つけることができる.ヒトを含む7つの生物種にそれぞれ適用したところ,出芽酵母等においては圧縮率がドメインの順序の有無でほとんど違いが見られなかった一方,ヒト等では数%異なり,生物種を増やした追加実験が必要である. またタンパク質とRNAの相互作用におけるアミノ酸残基と塩基との間の相互作用の予測精度の改善に関して,多重配列アラインメントから得られる相互情報量等を入力とし正規化線形関数を活性化関数とした5層のニューラルネットワークを提案した. この他に遺伝子発現プロファイルとタンパク質相互作用ネットワークから畳み込みニューラルネットワークを利用して肺がんを予測する手法などを開発した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
タンパク質相互作用の予測精度の改善が本研究課題の目的の一つであり,人工知能分野で利用されているニューラルネットワークを活用することで,タンパク質とRNAとの間の残基塩基相互作用を予測する手法の精度改善を達成した.またタンパク質のドメイン構成の進化解析についてはより多くの生物種に対して提案手法を適用し追加実験を行う必要がある.さらに閉路を含むグラフに対する圧縮手法の開発では実データへの適用による提案手法の有効性の検証が必要である.
|
今後の研究の推進方策 |
本研究課題において開発した技術の有効性の検証および追加実験を実施し学術誌論文としてまとめる.閉路を含むグラフに対する圧縮手法では理論的に導出した文法圧縮手法を実装し実データに適用する.またタンパク質のドメイン構成の進化解析については十分な数の生物種に対してドメインの配置を考慮した場合とそうでない場合に文法圧縮を適用しタンパク質のドメイン構成の獲得過程を比較解析する.
|
次年度使用額が生じた理由 |
当該年度までに国際会議において口頭発表を行った2件の圧縮技術に関する論文それぞれについて学術誌論文としてまとめる計画であり,掲載が決定した場合に掲載料が必要となるため.
|