2013 Fiscal Year Annual Research Report
ゲノム・オミックスデータ解析の安定化のための統計的方法論
Project/Area Number |
25280008
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
江口 真透 統計数理研究所, 大学共同利用機関等の部局等, 教授 (10168776)
|
Co-Investigator(Kenkyū-buntansha) |
松浦 正明 帝京大学, 公衆衛生学研究科, 教授(Professor) (40173794)
松井 茂之 名古屋大学, 医学(系)研究科(研究院), 教授 (80305854)
間野 修平 統計数理研究所, 数理・推論研究系, 准教授 (20372948)
野間 久史 統計数理研究所, 大学共同利用機関等の部局等, 助教 (70633486)
小森 理 統計数理研究所, 大学共同利用機関等の部局等, 特任助教 (60586379)
|
Project Period (FY) |
2013-04-01 – 2018-03-31
|
Keywords | 遺伝子発現 / クラスター / 乳がんデータ / 個人化治療 / 効果予測 |
Research Abstract |
遺伝子発現解析で起こる超高次元・小標本の状況における予測性能の安定化のための統計的方法論の開発について,集中的な研究を行った.その開発のため,計算プログラミングの研究補助員に予算を重点配分し,クラスタリングによるマーカー選択の方法の完成を第一に目指した。 これは,従来,情報のあるマーカー選択は,単独マーカーの性能(2標本検定のP 値)のランキングやホールドチェンジによるフィルタリングによって決めていたが,このやり方がデータごとに変動し不安定な挙動を示すことから,その解決策として考えたものである。すなわち,このマーカー選択によって予測解析を行うとよい性能が得られないのは,訓練データとテストデータのランキングやフィルタリングが大きく食い違うためであると考え,従来法と全く発想の違う観点からの選択法を提案したものであり,クラスタリングされたマーカーのクラスター構造が変動しないように,マーカーの選択を逐次減少法によって行うものである。 具体的には,全てのマーカーにk-平均法を行い,k 個のクラスターに分類した。ここでクラスター数k はサブタイプの情報から決めた。例えば乳がんデータにおいては4つのサブタイプが報告されているが,これに対して,マーカーの属するクラスターをクラスラベルと定義して,k-クラスのパタ-ン認識をフィッシャー線形判別によって予測し,このクラスターの構造が変わらないようにする変数(遺伝子)選択法を構築し,特にk平均法に変わる自発クラスタリングを開発した。これはクラスター数を自動的に推定できるアルゴリズムで,一般的な内容で論文発表したが,この問題に適用するために実験的に予備解析を行った。 12月,香港の国際会議の参加の際にアカデミア・シニカのS-Y. Huang 教授とクラスタリングについて総合的なディスカッションを行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度を終えた段階であるが,「LASSO クラスタリングによる開発」は実用化のレベルに到達した。これは膨大なマーカーの中から情報のあるマーカーを選択する,従来の方法に代わる新たな方法として有用であると思われる。 教師なし学習の内容で開発されたこの方法は,予めクラスター法を決めないで,データごとに適切に求める「自発クラスタリング」であり,これについても,ある程度実用化の目途がついた。また,一般的な機械学習の方法として開発されたロバスト独立成分の方法やAUC最大化による表現型予測の方法も,このプロジェクトで実用化を図りたい。 データベースGEO や過去の共同研究で得られたデータの,対象ごとに分類されたデータセットに対して,LASSO クラスタリングのマーカー選択法を適用してマーカーの候補を用意する.これらのデータセットの重みを決める方法については,未だ本格的な研究には着手していないが,予備的なデータの加工などについては開始されている。 次に 候補に選ばれたマーカーのゲノム・遺伝子・分子の特性情報を援用しての適切な絞り込みについても,最近の文献を調査している。また,データセットに共通なマーカーを決定し,ターゲットのデータセットにつけられた重みをもとめる最適な決定方式についても考察している。このように5年プロジェクトの初年度が終わった段階としては十分な達成度が得られたと考えている。
|
Strategy for Future Research Activity |
25年度に得られた結果によって,単独の実データに対する結果だけではなく,現時点,世界で得られている相同なデータに対する結果にも対応することが可能になってきた。これより安定した予測性能が確かめられた幾つかの判別式の中から,さらに実用に向けて,研究を推進させる必要がある。 選ばれた共通なマーカーを持つデータセットに対して,表現型予測のためのパタ-ン認識,回帰分析を実行する。このためブースト・アルゴリズムを並行して走らせメタラーニングを行う。アルゴリズムは単に独立に走らせるのではなく各ステップで相互に学習結果を補正しあうことを考える。 このように各々のブースト・アルゴリズムに対してアップデートで結合する複数個のマーカーをプールしておき,その中で並列しているアルゴリズムで結合するマーカーが異なる場合には正則化によるペナルティを課し,できるだけ共通なマーカーを結合することが可能な学習則を構築する。そして得られたm 個の判別式には相似性があり,どのデータセットに対しても安定した予測性能を持つ。これをテスト用に取ってあったデータを使って検証する。 最近の研究で,表現形によって予測のための特徴パターンが大きく異なることが分かった。ターゲットにする表現形は,薬剤奏功性なのか,予後なのかで,予測解析も異なることになる。このような点を中心に,がん研究会,国立がんセンターの医学専門家の協力体制のもと,総合的に検討し,個別化医療のための予測キットの実用化を検討する。このようにして得られた成果を,活発な展開が成されている次世代シーケンサーの研究との関連からも模索する。
|
Expenditure Plans for the Next FY Research Funding |
総合的ディスカッションを予定していたウォーリック大学(UK)のJ.Copas教授が、スケジュール調整がつかず来日できなかったため。 2014年9月21日から9月26日に開催される"The thirty threeth International Workshop on Bayesian Inference and Maximum Entropy Methods in Science and Engineering"で、江口と小森がこれまでの研究成果の発表を行う予定であるが、遠方(フランス・アンボワーズ)で多額の費用が見込まれるため、昨年度生じた未使用額を合わせてこれに充てる。
|
Research Products
(28 results)
-
[Journal Article] Development of detection method for novel fusion gene using GeneChip Exon Array2014
Author(s)
Wada, Y., Matsuura, M., Sugawara, M., Ushijima, M., Miyata, S., Nagasaki, K., Noda, T. and Miki, Y.
-
Journal Title
Journal of Clinical Bioinformatics
Volume: 4
Pages: -
DOI
Peer Reviewed
-
[Journal Article] Incidence and predictor of invasive disease and nodal metastasis in preoperatively diagnosed ductal carcinoma in situ2014
Author(s)
Osako, T., Iwase, T., Ushijima, M., Horii, R., Fukami, Y., Kimura, K., Matsuura, M. and Akiyama, F.
-
Journal Title
Cancer Science
Volume: 105
Pages: 576-582
DOI
Peer Reviewed
-
[Journal Article] The interaction of a single-nucleotide polymorphism with age on response to interferon-alpha and ribavirin therapy in female patients with hepatitis C infection2014
Author(s)
Nishino, J., Sugiyama, M., Nishida, N., Tokunaga, K., Mizokami, M. and Mano, S.
-
Journal Title
Journal of Medical Virology
Volume: 86
Pages: 1130-1133
DOI
Peer Reviewed
-
-
[Journal Article] Distinct cancer-specific survival in metastatic prostate cancer patients classified by a panel of single nucleotide polymorphisms of cancer-associated genes2013
Author(s)
Tsuchiya, N., Matsui, S., Narita, S., Kamba, T., Mitsuzuka, K., Hatakeyama, S., Horikawa, Y., Inoue, T., Saito, S., Ohyama, C., Arai, Y., Ogawa, O. and Habuchi, T.
-
Journal Title
Genes Cancer
Volume: 4
Pages: 54-60
DOI
Peer Reviewed
-
[Journal Article] Telomere Shortening in the Esophagus of Japanese Alcoholics: Relationships with Chromoendoscopic Findings, ALDH2 and ADH1B Genotypes and Smoking History2013
Author(s)
Aida, J., Yokoyama, A., Shimomura, N., Nakamura, K., Ishikawa, N., Terai, M., Poon, S., Matsuura, M., Fujiwara, M., Sawabe, M., Arai, T. and Takubo, K.
-
Journal Title
PLoS One
Volume: 8
Pages: 1-7
DOI
Peer Reviewed
-
-
-
[Journal Article] Nested case control study of proteomic biomarkers for interstitial lung disease in Japanese patients with non-small-cell lung cancer treated with erlotinib: a multicenter phase IV study (JO21661)2013
Author(s)
Atagi, S., Katakami, N., Yoshioka, H., Fukuoka, M., Kudoh, S., Ogiwara, A., Imai, M., Ueda, M. and Matsui, S.
-
Journal Title
Clin Lung Cancer
Volume: 14
Pages: 407-417
DOI
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-