2007 Fiscal Year Annual Research Report
大規模変数次元データの因果構造マイニング手法開発と遺伝子機能関係知識べースの作成
Project/Area Number |
19200013
|
Research Institution | Osaka University |
Principal Investigator |
鷲尾 隆 Osaka University, 産業科学研究所, 教授 (00192815)
|
Co-Investigator(Kenkyū-buntansha) |
狩野 裕 大阪大学, 基礎工学研究科, 教授 (20201436)
井元 清哉 東京大学, 医科学研究所, 准教授 (10345027)
大原 剛三 大阪大学, 産業科学研究所, 助教 (30294127)
猪口 明博 大阪大学, 産業科学研究所, 助教 (70452456)
TERMIER Alexandre 大学共同利用機関法人情報・システム研究機構, (新領域融合研究センター), 特任研究員 (60435823)
|
Keywords | 統計的因果推論 / 独立成分分析 / グラフマイニング / 遺伝子発現度測定データ / 大規模変数次元データ / 因果ネットワーク / 高速相関係数推定 |
Research Abstract |
本研究の第1目的は,一般計算機を用いて数千〜数百万次元の大規模変数次元データから,因果関係が明確な部分変数間因果ネットワークを効率的に完全探索することである.そのため,東大・医科研の研究分担者を通じ,遺伝子発現度測定データの提供を受けた.そして,提供データ及び人工データをテストベッドとして,阪大・産研の研究代表者と阪大・基礎工及び統数研の研究協力者の協力により,グラフマイニングの枠組みに統計的因果推論を組み込む検討を実施した.そして,大規模変数次元ベクトルデータからの部分因果ネットワークを推定する手法の開発を行った. 具体的には,マイクロアレー上の各遺伝子に対応する格子点5千個の変数次元ベクトルで表される比較的少数の検体データについて,独立成分分析(ICA)による統計的因果推論を施し,各変数間の因果関係を同定する検討を行なった.次に,このようにして同定した多数の因果関係ネットワークの集合データにグラフマイニングを適用し,多数の変数の間に安定して見られる変数間因果関係を同定した.解決に取り組んだ技術課題としては,(1)変数個数mが巨大なため,その計算量を低減する高速全相関係数推定アルゴリズム開発,(2)推定相関係数行列からの独立成分分析(ICA)による統計的因果推論手法,(3)安定した因果ネットワークを得るグラフマイニング手法の検討,(4)無駄のないアルゴリズム開発,(5)提供データ及び人工データをテストベッドとした部分因果ネットワーク推定手法の改良調整等が挙げられる.これらの取り組みにより第1目的はほぼ達成されたと考える.
|
Research Products
(10 results)