研究課題/領域番号 |
22240009
|
研究機関 | 京都大学 |
研究代表者 |
阿久津 達也 京都大学, 化学研究所, 教授 (90261859)
|
研究分担者 |
永持 仁 京都大学, 情報学研究科, 教授 (70202231)
川端 猛夫 京都大学, 化学研究所, 教授 (50214680)
林田 守広 京都大学, 化学研究所, 助教 (40402929)
|
研究期間 (年度) |
2010-04-01 – 2015-03-31
|
キーワード | カーネル法 / 特徴ベクトル / 化学構造 / グラフ理論 / 木構造 / 構造列挙 / 構造比較 / 異性体 |
研究概要 |
今年度は以下を中心に研究を行った。 (1) 環を1個含む化学構造の列挙アルゴリズムの開発。昨年度までは木構造を持つ化学構造(木状化合物)の列挙を中心に研究を行ってきたが、対応できる化合物のクラスを広げるための研究を行った。具体的には、パス頻度に基づく特徴ベクトルの上下限制約のもとで、(ベンゼン環以外にも)環を1個含む構造まで許した化学構造を列挙するアルゴリズムを開発した。計算機実験の結果、出力構造1個あたりの計算時間は木状化合物の場合と同程度であることがわかり、開発手法の有用性を確認することができた。 (2) 幅優先探索による木状化合物の列挙アルゴリズムの開発。これまでは深さ優先探索により木状化合物を数え上げるという方法論を用いてきたが、別のアプローチも検討するために、幅優先探索に基づく木状化合物の列挙手法を開発した。深さ優先探索の場合と異なり計算量に関する理論的な解析はできておらず、また、特徴ベクトルによる制約への対応もできていないが、分子式のみを与えての列挙については計算機実験の結果、深さ優先探索に基づく手法と同程度以上の速度で動作することを確認することができた。 (3) 化合物の最大共通部分構造検出問題の計算論的解析。2個の化合物の構造比較の定式化の一つとして、最大共通部分グラフ検出問題がある。この問題は一般にはNP困難であるが、木に類似した構造(次数制約つきalmost k-tree)については多項式時間で計算可能であることが知られていた。しかしながら、他のクラス、特に多くの化合物を含むグラフのクラスについては、その計算複雑度が知られていなかった。研究の結果、この問題は、次数制約のある外平面的グラフについて多項式時間で解け、一方、k≧11の部分k木については次数制約があってもNP困難であることが判明した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
構造列挙アルゴリズム自体の開発は木状化合物以外への対応が可能になりつつあるなど順調に進展しており、また、化学構造比較の計算複雑度に関して新たな知見を得るなど計画以外の有用な成果も得られたが、スコア関数の学習および最適化法については今年度も有効な結果を得ることができなかった。
|
今後の研究の推進方策 |
平成25年度は、効率良く列挙可能となる化合物のクラスを拡大することに重点を置いて研究を行う。特に、2個以上の環を持つ化合物の列挙を効率良く行うための深さ優先探索に基づくアルゴリズムの開発を行うとともに、部品を組み合わせることにより列挙を行う幅優先探索に基づくアルゴリズムの開発を行う。 また、これまで十分に取り組むことのできなかった課題、特に、スコア関数の学習アルゴリズム、および、そのスコア関数のもとで最適な特徴ベクトルを選択するためのアルゴリズムの研究開発も重点的に行う。 さらに、化合物設計のためには標的となるタンパク質などの生体高分子や代謝ネットワークなどの生物情報ネットワークの解析も重要であるので、これらの研究も継続して行う。
|