2013 Fiscal Year Research-status Report
複数の遺伝要因及び環境要因の組み合わせを考慮したゲノムワイド相関解析法の開発
Project/Area Number |
25700004
|
Research Category |
Grant-in-Aid for Young Scientists (A)
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
西郷 浩人 九州工業大学, 情報工学研究院, 准教授 (90586124)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | ゲノムワイド相関解析(GWAS) / epistasis / 情報量基準 / カーネル法 / 頻出パターンマイニング / 国際情報交換、ドイツ |
Research Abstract |
近年のゲノムワイド相関解析の進展により疾患遺伝子の特定が進んでいるが、既存の方法の多くは単一の遺伝要因が疾患の原因であるというモデルに基づいた単一遺伝子の探索である。一方で、多くの複雑な疾患は複数の遺伝要因と環境要因が合わさることにより起こると考えられている。そこで、本提案研究ではデータマイニングと統計の手法を用いて、疾患を引き起こす複数の遺伝要因や環境要因の組み合わせの特定に取り組んでいる。より具体的には、問題を以下の2つに切り分けている。 1)疾患の情報と遺伝情報が与えられた時に、疾患に関係する遺伝要因の数の上限の理論的及び経験的見積もり。 2)疾患の情報と遺伝情報が与えられた時に疾患に関係する遺伝要因の直接探索。 1)、2)共に、疾患の情報が有る無し(離散2値)で与えられている場合と連続値で与えられている場合について取り組んでいる。連続値の場合についてはサンプル数に対して遺伝要因の数が小さい場合についてはある程度の推定能力をもつという実験結果がシミュレーションデータより得られている。しかしながら疾患の情報が離散2値で与えられている場合についての推定能力はかなり限定されており、現在原因の究明を行っている。 2)については、組み合わせ空間の完全探索ではなく統計的枝刈りを用いた部分探索を行っているが、それでも遺伝要因の数が増えると計算量が大幅に増加するという問題がある。現在のところ複数の発見的手法を用いることにより遺伝要因の数が1000程度の状況での計算も可能となっているが、更なる高速化に向けて改良中である。 1)、2)ともに研究の中間成果は国内学会である情報学的学習理論と機械学習研究会(IBIS2014)にて報告している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
上記研究内容1)、2)ともにシミュレーションデータにおける実験では比較的良い結果が出ている。今後は実際のデータにおける実験を行うとともに、両手法の更なる高速化に取り組む。
|
Strategy for Future Research Activity |
当初の計画では遺伝型と疾患の関係のデータを産業医科大学又は飯塚病院から提供を受ける予定であったが、今のところ実現していない。その代わりに学内での共同研究を通じてArabidopsis Thalianaのデータを入手した。また、独マックスプランク研究所の研究者を通じてマウスのデータの提供も受けており、提案手法の評価方法について問題は生じていない。 それ以外の研究の推進方法については研究計画書通りに行える見込みである。
|
Expenditure Plans for the Next FY Research Funding |
今年度は見込みよりも謝金の支払いが少なかったため、余剰金が生じた。 成果発表の為の学会参加費用、もしくは今年度の謝金の支払いに使用する予定である。
|
Research Products
(5 results)