Research Abstract |
本研究では,数千以上の変数から成る大規模次元データから,変数間の因果関係が明確な部分を完全探索し,その因果関係ネットワークを同定する効率的手法の開発を第1目的とする.更に,この手法を遺伝子発現データに適用し,遺伝子の未知機能を明らかにするための遺伝子発現因果関係に関する知識べースの効率的作成と公開を第2目的とする. 遺伝子発現実験では,コストや倫理の制約から,得られる検体事例数が多くても数十程度に限られることが多いにも拘わらず,各遺伝子発現度を表す変数は数千個以上にもなる.今年度は,初年度に検討した因果ネットワーク推定手法を発展させ,このような過小データから,投薬などの種々の外部からの刺激に対して,生体細胞内で最初に反応して発現する遺伝子群,即ち,外部刺激に対して受容体を構成する遺伝子群を同定する手法を開発した.これを実現するためには,与えられたデータに含まれる全変数の中で,因果関係上最上流に位置する変数群,即ち,外生的変数の集合を探索することが必要である.これを,因果的に上流に位置する変数ほど,その値の統計的揺らぎが非ガウス分布に従うことが多いと期待されるという仮定に基づき,独立成分分析の基礎原理を適用することによって達成した.そして,この手法を,National Center for Biotechnology Informationにて公開されている治療薬物を投与したる白血病細胞や乳がん細胞の遺伝子発現データに適用し,各薬物がどの遺伝子に働きかけるのかを同定した. 本研究は,大阪大学基礎工学研究科の狩野裕教授,同大学産業科学研究所の大原剛三助教,猪口明博助教,東京大学医科学研究所の井元清哉准教授を連携研究者として,上記成果を得た.
|