2016 Fiscal Year Annual Research Report
ゲノム・オミックスデータ解析の安定化のための統計的方法論
Project/Area Number |
25280008
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
江口 真透 統計数理研究所, 大学共同利用機関等の部局等, 教授 (10168776)
|
Co-Investigator(Kenkyū-buntansha) |
松浦 正明 帝京大学, 公私立大学の部局等, 教授 (40173794)
松井 茂之 名古屋大学, 医学(系)研究科(研究院), 教授 (80305854)
小森 理 福井大学, 工学(系)研究科(研究院), その他 (60586379)
間野 修平 統計数理研究所, 数理・推論研究系, 准教授 (20372948)
野間 久史 統計数理研究所, 大学共同利用機関等の部局等, 准教授 (70633486)
|
Project Period (FY) |
2013-04-01 – 2018-03-31
|
Keywords | 遺伝子発現 / クラスター / 乳がんデータ / ベキエントロピー / ゲノムワイド探索 |
Outline of Annual Research Achievements |
ゲノム・オミックスデータ解析について安定化のための統計的方法論の開発に努めてきた。特にオミックスデータに基づく表現型の予測問題についてその安定性について追及し、疾病関連マーカーの再現性が高い探索法をU統計量などサブサンプリングの方法を使った提案を論文発表した。この方法はランキングをサブサンプリング毎に多重に計算して平均化するものである。これによってある程度の改善は達成できたが、依然として完全な解決が得られたという状況にない。このランキングに基づいた表現型予測を準線形予測子を援用して安定した性能を持たせる方法の開発に向かっている。この準線形スコア―とは複数の線形スコアーを非線形に結合する方法である。これはオミクスデータに内在する異型性を自然に対応させた複数個の線形予測子を非線形に結合する方法である。このモデルは汎用性が高く一般化線形モデルの枠組みで適用可能であり、さらにコックスの比例ハザードモデルも準線形の形に拡張が考えられるので、統計モデルの一般的な考察の中でも展開することを計画中である。この非線形結合はニューラルネットワークにおける活性化関数の役割と符合する。特に対数指数関数の逆温度をを無限大にとるとディープラーニングにおけるMaxoutニューラルネットと密接な関係が見つかった。また疎性正則化によるマーカー選択も同時にできる形でアルゴリズムが出来上がっている。基本的な問題はほぼ解決しているので、さらに実用性に重点をおいた開発を完結させたい。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現時点において、従来の特徴量を線形に結合する線形スコア―の限界を超えるために準線形スコア―に拡張に一定の成果が得られた。典型的なつなぎ方は全てのマーカー値の中から特に高い値のマーカー値のみを採用し,相対的に低い値のマーカー値は無視するようなつなぎ方となっている.この準線形スコア―を使ってゲノム・オミックス研究のデータについて総合的な立場から検証する方法を検討した。準線形性の研究は始めたばかりなので、未だ明らかにされてない点多く,この非線形性の特徴をつかむことが急務となっていたが、ディープラーニングとの関連性から糸口が見つかりつつある。特にこの準線形性の持つ数理的な特徴づけについて6月13日から17日まで開催されるチェコで開催された国際会議「Information Geometry and its Applications IV」で招待講演を行った.
|
Strategy for Future Research Activity |
これまでゲノム研究やオミックス研究において各々の観測で帰結された結論を統合するための方法論の開発を目指してきた。この統計解析の困難さの主要な原因はサンプル分布の極端な異型性の問題にあり、再現性を高めた遺伝子ランキングの方法を発表している。この内容でオミクスデータに内在する異型性について焦点を当て、異形成を素直に反映した非線形予測の方法の開発を更に進めていきたい.この準線形予測子によって表現型の予測の安定化の最終的な解決を目指したい.予測性能の再現性を高める方法論の開発に重点を置いていきたが、これまでに得られた成果を活発に展開させて予測問題に限らない新たな観点から新しい方向の提言を行っていきたい。新しい形式のデータ、例えば拡散テンソルデータなどにも着目して、これまでの方法論の成果の拡大を図りたい。
|
Causes of Carryover |
旅費
|
Expenditure Plan for Carryover Budget |
旅費
|
Research Products
(23 results)
-
-
-
-
-
-
-
[Journal Article] An asymmetric logistic regression model for ecological data2016
Author(s)
Komori, O., Eguchi, S., Ikeda, S., Okamura, H., Ichinokawa, M. and Nakayama, S.
-
Journal Title
Methods in Ecology and Evolution
Volume: 7(2)
Pages: 249-260
DOI
Peer Reviewed
-
-
-
-
-
-
[Journal Article] Clinical and microarray analysis of breast cancers of all subtypes from two prospective preoperative chemotherapy studies.2016
Author(s)
Okuma, H., Koizumi, F., Hirakawa, A., Nakatochi, M., Komori, O., Hashimoto,J., Kodaira, M., Yunokawa, M., Yamamoto, H.,Yonemori, K., Shimizu, C.,Fujiwara, Y. and Tamura, K.
-
Journal Title
British Journal of Cancer
Volume: 115
Pages: 411-419
DOI
Peer Reviewed
-
-
[Presentation] Two paradigms in statistical prediction2017
Author(s)
S.Euchi
Organizer
The International Conference on Bioinformatics and Biostatistics for Agriculture Health and Environment
Place of Presentation
University of Rajshahi in Bangladesh
Year and Date
2017-01-20 – 2017-01-23
Int'l Joint Research / Invited
-
[Presentation] Asymmetric logistic regression model2017
Author(s)
Komori, O.
Organizer
The International Conference on Bioinformatics and Biostatistics for Agriculture Health and Environment,
Place of Presentation
University of Rajshahi in Bangladesh
Year and Date
2017-01-20 – 2017-01-23
Int'l Joint Research / Invited
-
-
-
-
-
-
-