研究課題/領域番号 |
26240034
|
研究機関 | 京都大学 |
研究代表者 |
阿久津 達也 京都大学, 化学研究所, 教授 (90261859)
|
研究分担者 |
林田 守広 京都大学, 化学研究所, 助教 (40402929)
永持 仁 京都大学, 情報学研究科, 教授 (70202231)
細川 浩 京都大学, 情報学研究科, 講師 (90359779)
|
研究期間 (年度) |
2014-04-01 – 2019-03-31
|
キーワード | ケモインフォマティクス / 構造列挙 / グラフアルゴリズム / カーネル法 / 生物情報ネットワーク / 化学構造 |
研究実績の概要 |
化学構造の列挙については、以前より開発していたベンゼン環を木構造に加えた場合の動的計画法による列挙手法を完成させ、研究成果を論文としてまとめた。また、木構造に辺を2個および3個加えた場合の列挙手法の開発を進めた。一方、効率は多少落ちるものの幅優先探索法に基づくより単純な手法の開発も継続し、ユーザが指定した任意の環構造を扱うための拡張に成功し、研究成果を論文としてまとめた。 配列解析については、病原体タンパク質と宿主タンパク質間の相互作用予測という問題に取り組んだ。両者のタンパク質配列データから長さ3のアミノ酸断片の出現頻度に基づく特徴量と、宿主タンパク質についての既知のタンパク質相互作用ネットワークから抽出した特徴量を組み込んだ特徴ベクトルを開発した。これに確率的勾配降下法およびSCW(Soft Confidence-Weighted)法という機械学習手法と組み合わせた方法を開発し既存手法と比較した結果、その有用性を示すことができた。一方、miRNAの配列データからの切断部位予測という問題にも取り組み、新たな特徴ベクトルを開発し、既存の特徴ベクトルと比較して良い予測精度を得ることができた。 代謝ネットワークに関しては、正常細胞と異常細胞の遺伝子発現データが与えられた際に、遺伝子ノックアウト後の結果がそれらのデータとできるだけ整合するようにマーカー頂点を選択するという問題の定式化を行い、整数計画法に基づく選択手法を開発し、実データを用いた計算機実験によりその有効性を確認した。 RNA二次構造予測について、整数計画法を用いる計算手法の開発とその生物学実験を通じた評価・改良という情報系と生物系の研究者間の共同研究を以前より行っていたが、その研究成果を論文にまとめることができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
化学構造の列挙については順調に進展している。しかしながら、化合物のカーネル回帰などによる活性予測とそこからの特徴ベクトル抽出については模索中であり、十分な結果が得られていない。 代謝ネットワーク設計に関しては、遺伝子発現データを代謝ネットワークの組み合わせによるマーカー遺伝子の推定手法という新たな展開を図ることができ、多少方向性が異なるものの順調に進展したと判断できる。 タンパク質配列設計に関しては、病原体タンパク質と宿主タンパク質間の相互作用予測、miRNAの切断部位予測の両者について新規な計算手法が開発でき、こちらも多少方向性が異なるものの順調に進展したと判断できる。
|
今後の研究の推進方策 |
化学構造の列挙については手法の開発は順調に進展しているので、論文としてまとめることや、サーバとして公開することへの努力を継続する。 カーネル回帰に基づく特徴ベクトル抽出については大学院生の協力を得るなどして引き続き遅れを取り戻すよう努力する。 代謝ネットワークやタンパク質配列の設計については多少方向性がずれているが着実に成果は出ているので引き続き研究を継続する。
|