研究課題/領域番号 |
25700004
|
研究種目 |
若手研究(A)
|
研究機関 | 九州工業大学 |
研究代表者 |
西郷 浩人 九州工業大学, 情報工学研究院, 准教授 (90586124)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | ゲノムワイド相関解析(GWAS) / epistasis / 情報量基準 / カーネル法 / 頻出パターンマイニング / 国際情報交換、ドイツ |
研究概要 |
近年のゲノムワイド相関解析の進展により疾患遺伝子の特定が進んでいるが、既存の方法の多くは単一の遺伝要因が疾患の原因であるというモデルに基づいた単一遺伝子の探索である。一方で、多くの複雑な疾患は複数の遺伝要因と環境要因が合わさることにより起こると考えられている。そこで、本提案研究ではデータマイニングと統計の手法を用いて、疾患を引き起こす複数の遺伝要因や環境要因の組み合わせの特定に取り組んでいる。より具体的には、問題を以下の2つに切り分けている。 1)疾患の情報と遺伝情報が与えられた時に、疾患に関係する遺伝要因の数の上限の理論的及び経験的見積もり。 2)疾患の情報と遺伝情報が与えられた時に疾患に関係する遺伝要因の直接探索。 1)、2)共に、疾患の情報が有る無し(離散2値)で与えられている場合と連続値で与えられている場合について取り組んでいる。連続値の場合についてはサンプル数に対して遺伝要因の数が小さい場合についてはある程度の推定能力をもつという実験結果がシミュレーションデータより得られている。しかしながら疾患の情報が離散2値で与えられている場合についての推定能力はかなり限定されており、現在原因の究明を行っている。 2)については、組み合わせ空間の完全探索ではなく統計的枝刈りを用いた部分探索を行っているが、それでも遺伝要因の数が増えると計算量が大幅に増加するという問題がある。現在のところ複数の発見的手法を用いることにより遺伝要因の数が1000程度の状況での計算も可能となっているが、更なる高速化に向けて改良中である。 1)、2)ともに研究の中間成果は国内学会である情報学的学習理論と機械学習研究会(IBIS2014)にて報告している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
上記研究内容1)、2)ともにシミュレーションデータにおける実験では比較的良い結果が出ている。今後は実際のデータにおける実験を行うとともに、両手法の更なる高速化に取り組む。
|
今後の研究の推進方策 |
当初の計画では遺伝型と疾患の関係のデータを産業医科大学又は飯塚病院から提供を受ける予定であったが、今のところ実現していない。その代わりに学内での共同研究を通じてArabidopsis Thalianaのデータを入手した。また、独マックスプランク研究所の研究者を通じてマウスのデータの提供も受けており、提案手法の評価方法について問題は生じていない。 それ以外の研究の推進方法については研究計画書通りに行える見込みである。
|
次年度の研究費の使用計画 |
今年度は見込みよりも謝金の支払いが少なかったため、余剰金が生じた。 成果発表の為の学会参加費用、もしくは今年度の謝金の支払いに使用する予定である。
|