2014 Fiscal Year Annual Research Report
グラフ構造データから統計的に有意に頻出する部分構造を発見する手法の研究
Project/Area Number |
26880013
|
Research Institution | Osaka University |
Principal Investigator |
杉山 麿人 大阪大学, 産業科学研究所, 助教 (10733876)
|
Project Period (FY) |
2014-08-29 – 2016-03-31
|
Keywords | グラフマイニング / 部分グラフ / 多重検定 / 検定可能性 / 実効的検定数 / 高速化 / 国際研究者交流 / スイス連邦 |
Outline of Annual Research Achievements |
本研究の目的は,与えられたグラフ集合から,統計的に有意に頻出する部分グラフをすべて発見する手法の構築である.平成26年度は,研究計画にしたがって,検定可能性を用いた多重検定補正法を設計し,有意な部分グラフを列挙するアルゴリズムの構築及び実装と,実データによる検証をおこなった. 研究成果の具体的内容は,以下のとおりである.まず,検定可能性と呼ばれる統計的性質を導入し,検定可能部分グラフと頻出部分グラフの間の関係を明らかにした.次に,既存の部分グラフ発見アルゴリズムを利用することで,検定可能な部分グラフを列挙するアルゴリズムを構築・実装した.最後に,化合物などの実世界のベンチマークデータを用いて,構築したアルゴリズムの有効性を検証した.その結果,既存手法とくらべて1000倍程度の高速化を達成し,かつ誤発見の確率が適切に制御できることを確認した. さらに,計画段階では平成27年度に取り組む予定であった実効的検定数の導入についても研究を進め,構築したアルゴリズムに実効的検定数の計算を組み込むことに成功した.ベンチマークデータによる実験の結果,誤発見確率は適切に制御され,かつ検出力が向上することを確認した. これら構築したアルゴリズムを用いることで,例えば創薬において,化合物データベースから特定の活性をもつ化合物が共有している部分構造を見つけ出し,かつそれらの統計的有意性を担保することができる.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
平成26年度の研究計画で示した課題を全て達成し,かつ,平成27年度に取り組む予定であった課題である実効的検定数の導入についても達成した.
|
Strategy for Future Research Activity |
引き続き,統計的に有意な部分グラフを発見する手法の構築・洗練に取り組む.これまでの実験によって,現在までに構築したアルゴリズムによる誤発見の制御は保守的すぎ,重要な部分グラフを見逃している可能性があることがわかった.そこで,ランダム置換を用いた多重検定法を利用することで,誤発見確率の最適化を実現する.また,近年提案されているこのランダム置換法の高速化アルゴリズムの統合について研究を進める.さらに,バイオインフォマティクスやケモインフォマティクスなどの応用分野への適用可能性についても検討する.
|
Research Products
(4 results)
-
-
-
[Journal Article] Genome-Wide Detection of Intervals of Genetic Heterogeneity Associated with Complex Traits2015
Author(s)
Llinares-Lopez, F., Grimm, D.G., Bodenham, D.A., Gieraths, U., Sugiyama, M., Rowan, B., Borgwardt, K.M.
-
Journal Title
Bioinformatics
Volume: 未定
Pages: 未定
Peer Reviewed / Acknowledgement Compliant
-