確率的ダイナミカルシステムとしての生物構造予測とその高精度化
Project/Area Number |
20810034
|
Research Category |
Grant-in-Aid for Young Scientists (Start-up)
|
Allocation Type | Single-year Grants |
Research Field |
ゲノム情報科学
|
Research Institution | Waseda University |
Principal Investigator |
KABURAGI Takashi Waseda University, 理工学術院, 助手 (10468861)
|
Project Period (FY) |
2008 – 2009
|
Project Status |
Completed (Fiscal Year 2009)
|
Budget Amount *help |
¥1,638,000 (Direct Cost: ¥1,260,000、Indirect Cost: ¥378,000)
Fiscal Year 2009: ¥468,000 (Direct Cost: ¥360,000、Indirect Cost: ¥108,000)
Fiscal Year 2008: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | バイオインフォマティクス / タンパク質構造予測 / 遺伝子発現ネットワーク予測 / ベイズ学習 / モンテカルロ近似 / 生体分子構造解析及び予測 / 確率的情報処理 |
Research Abstract |
この研究はタンパク質のうち様々な分野から注目されている膜タンパク質の構造を予測するアルゴリズムを構築するものである。膜タンパク質構造予測問題は生命科学のみならず、創薬の分野などへの効果も期待されている。膜タンパク質は生体膜に存在し、細胞間情報伝達や物質の輸送など生命活動の基本的機能を果たしている。ゲノム中の20~30%は膜タンパク質をコードしているといわれており、その構造解明は創薬を含めいくつかの分野で重要と考えられている。しかし、膜タンパク質は結晶化が困難であり、立体構造が解明されているタンパク質のうち膜タンパク質は1%程度とまだ少ない。このような背景から機械学習による膜タンパク質構造予測アルゴリズムの開発が注目されている。 本研究では機械学習手法の1つ、隠れマルコフモデル(Hidden Markov Model、HMM)を用いる。HMMは時系列性のあるデータのモデル化に広く用いられており、手書き文字認識、音声認識、署名照合などの幅広い分野に応用されている。HMMでは観測されるデータの背後に「状態」が存在すると仮定する手法である。本研究では膜タンパク質の特徴的な構造をグラフ構造として表現し、膜貫通領域の数と膜貫通領域を予測するアルゴリズムを構築することを目指した。 具体的には膜タンパク質構造の予測問題に対し、HMMのBayes的アプローチをモンテカルロ実装したアルゴリズムを提案し、国際会議にて報告した。その際、新たな課題も見つかった。その対策としてモデルをDirichlet Process先験分布を用いて拡張することを提案し、初期的な実験を行った。 また、遺伝子はタンパク質を符号化し、一方タンパク質は遺伝子発現量を制御する。したがって一般に遺伝子制御ネットワークはフィードバックを含むダイナミックなネットワークと考えられる。その構造の解明は、構造そのものに対する興味以外に、いくつかの困難な疾患の原因解明とその治療への足がかりとして重要な役割を演じている。この問題に対しても機械学習的手法により多くの成果がある。 遺伝子発現制御ネットワーク予測問題に対しては、グラフ構造の事前知識としてスケールフリー性を考慮したアルゴリズム提案し国際会議にて報告し、論文化した。さらに、データの非正規性・非線形性を考慮する必要が確認されたため、2つのアプローチを試みた。データの非正規性にはBox-Cox変換を用いたデータ正規化アルゴリズムを、非正規性には無限中間素子ニューラルネットワークを用いたアルゴリズムを提案し、ごく初期的な実験結果を得つつある。
|
Report
(3 results)
Research Products
(20 results)