2016 Fiscal Year Research-status Report
インタラクティブな大規模ベイジアンネットワーク推定法の提案と生物データへの応用
Project/Area Number |
15K00402
|
Research Institution | Osaka University |
Principal Investigator |
竹中 要一 大阪大学, 情報科学研究科, 准教授 (00324830)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 生物情報学 / ベイジアンネットワーク / 遺伝子制御ネットワーク |
Outline of Annual Research Achievements |
ベイジアンネットワーク(BN)は、変数間の因果関係をグラフ構造で表現する確率モデルであり,遺伝子制御ネットワーク推定や疾患関連SNP推定等に利用されてきた汎用性の高い手法である.しかしながらBNには2つの弱点がある.1)計算に時間がかかる事と,2)インタラクティブ性がない事である.ここでインタラクティブ性とは,BNによる推定結果に基づき,既知情報や解析者の予測推定を事後的に加える試行錯誤を可能とする機構を指す.本研究は両者を解決するアルゴリズムの提案する事を目的としている. 本年度は,研究目的にて提示したベイジアンネットワークの3つの問題点,「大規模化」「インタラクティブ性」「因果関係比較」のうち,「大規模化」に焦点をあてた研究を行った.データ解析をするにあたり事象間の原因と結果を表す因果関係は、単に事象間の変化が類似している事を表す相関関係よりも重要である。この因果関係を表現するモデル及び因果関係の推定手法として,ベイジアンネットワークは小規模なデータ解析に大きく貢献してきた。ベイジアンネットワークの問題点として、因果関係の推定に必要な計算量が事象の数に対して指数関数的に増加する事、すなわち実用的な時間で因果関係の推定を可能とする事象の数が少ない事が挙げられる。この問題の解決アルゴリズムとして,我が提案したDivide & Reconstruction法に基づく解法が有効である.しかし大規模なベイジアンネットワークを正確に推定するには,より多数の観測データが必要になる.本年度は当該部分に着目し,少数の観測データから高精度な推定を行うためには偽陽性を減らす事が有効である事を明らかとした.そして,偽陽性を減らす為には従来より推定に用いられている情報量基準に加えて,統計学の検定結果を利用する事が有効である事を明らかとした.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,研究目的にて提示したベイジアンネットワークの3つの問題点,「大規模化」「インタラクティブ性」「因果関係比較」のうち,「大規模化」に焦点をあてた研究を行った.この大規模化を行うにあたり必要となる概念は昨年度の研究にて確立した.これを活用して大規模なベイジアンネットワーク推定を高精度に行うために必要な事項を部分問題化し,それぞれに対して一定の解答を与える事ができた.すなわち,1)アルゴリズムとしてはDivide & Reconstruction法を,2)ネットワーク規模に比較して少ない観測データ数がもたらす影響を解析し,3)その影響を緩和するための方策として情報量基準と統計学の検定を組み合わせる事が有効である事を明らかとする事ができた.この部分は順調に進んでいる.これらの実装は低並列度においては実現できたものの,高い並列化度を実現できていない.これについては当初想定したよりも記憶領域を必要とする事があきらかとなった事が原因である.これに伴い一コアあたりのメモリ量,転送量がボトルネックとなっていると思われる.この部分については,来年度の計画項目の一つである「効率的な並列化」にて問題の解決,あるいは緩和を試みる.
|
Strategy for Future Research Activity |
本研究課題は現在順調に推移しているため,今後の研究推進方策は計画通りとする.研究3年目の研究キーワードは「因果関係比較」である.これは,同一または類似事象に対して因果関係推定を行った複数の結果を比較する事を指す.Gene Expression Omnibus, Sequence Read Archiveなどのデータベースには多数の観測データが含まれている.各エントリーの実験条件は少しずつ事なるものの,類似しているものも多数含まれる.それらの観測データから因果関係を推定したベイジアンネットワークをそれぞれ推定する事ができる.しかし,これらを単純に結合する事は,当然にはできない.しかしながら,良質な知識を有する研究者が推定結果を解釈する事により,類似すべき部分,類似すべきでない部分,未知である部分という区分の考察が可能である.しかしこの考察をサポートする,具体的には試行錯誤的に因果関係を変更し,その影響範囲を観測するための機構は存在していない.この機構についての研究を実施する.
|
Causes of Carryover |
大規模並列化のボトルネック解消法を見出すまでは,物品の購入を止めておいたため,次年度への繰越が発生した.
|
Expenditure Plan for Carryover Budget |
来年度中に,当該物品の購入を実施する事により,繰越分の支出を発生させる.
|
Research Products
(5 results)