• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

ゲノム・オミックスデータ解析の安定化のための統計的方法論

研究課題

研究課題/領域番号 25280008
研究種目

基盤研究(B)

研究機関統計数理研究所

研究代表者

江口 真透  統計数理研究所, 大学共同利用機関等の部局等, 教授 (10168776)

研究分担者 松浦 正明  帝京大学, 公衆衛生学研究科, 教授(Professor) (40173794)
松井 茂之  名古屋大学, 医学(系)研究科(研究院), 教授 (80305854)
間野 修平  統計数理研究所, 数理・推論研究系, 准教授 (20372948)
野間 久史  統計数理研究所, 大学共同利用機関等の部局等, 助教 (70633486)
小森 理  統計数理研究所, 大学共同利用機関等の部局等, 特任助教 (60586379)
研究期間 (年度) 2013-04-01 – 2018-03-31
キーワード遺伝子発現 / クラスター / 乳がんデータ / 個人化治療 / 効果予測
研究概要

遺伝子発現解析で起こる超高次元・小標本の状況における予測性能の安定化のための統計的方法論の開発について,集中的な研究を行った.その開発のため,計算プログラミングの研究補助員に予算を重点配分し,クラスタリングによるマーカー選択の方法の完成を第一に目指した。
これは,従来,情報のあるマーカー選択は,単独マーカーの性能(2標本検定のP 値)のランキングやホールドチェンジによるフィルタリングによって決めていたが,このやり方がデータごとに変動し不安定な挙動を示すことから,その解決策として考えたものである。すなわち,このマーカー選択によって予測解析を行うとよい性能が得られないのは,訓練データとテストデータのランキングやフィルタリングが大きく食い違うためであると考え,従来法と全く発想の違う観点からの選択法を提案したものであり,クラスタリングされたマーカーのクラスター構造が変動しないように,マーカーの選択を逐次減少法によって行うものである。
具体的には,全てのマーカーにk-平均法を行い,k 個のクラスターに分類した。ここでクラスター数k はサブタイプの情報から決めた。例えば乳がんデータにおいては4つのサブタイプが報告されているが,これに対して,マーカーの属するクラスターをクラスラベルと定義して,k-クラスのパタ-ン認識をフィッシャー線形判別によって予測し,このクラスターの構造が変わらないようにする変数(遺伝子)選択法を構築し,特にk平均法に変わる自発クラスタリングを開発した。これはクラスター数を自動的に推定できるアルゴリズムで,一般的な内容で論文発表したが,この問題に適用するために実験的に予備解析を行った。
12月,香港の国際会議の参加の際にアカデミア・シニカのS-Y. Huang 教授とクラスタリングについて総合的なディスカッションを行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

初年度を終えた段階であるが,「LASSO クラスタリングによる開発」は実用化のレベルに到達した。これは膨大なマーカーの中から情報のあるマーカーを選択する,従来の方法に代わる新たな方法として有用であると思われる。
教師なし学習の内容で開発されたこの方法は,予めクラスター法を決めないで,データごとに適切に求める「自発クラスタリング」であり,これについても,ある程度実用化の目途がついた。また,一般的な機械学習の方法として開発されたロバスト独立成分の方法やAUC最大化による表現型予測の方法も,このプロジェクトで実用化を図りたい。
データベースGEO や過去の共同研究で得られたデータの,対象ごとに分類されたデータセットに対して,LASSO クラスタリングのマーカー選択法を適用してマーカーの候補を用意する.これらのデータセットの重みを決める方法については,未だ本格的な研究には着手していないが,予備的なデータの加工などについては開始されている。
次に 候補に選ばれたマーカーのゲノム・遺伝子・分子の特性情報を援用しての適切な絞り込みについても,最近の文献を調査している。また,データセットに共通なマーカーを決定し,ターゲットのデータセットにつけられた重みをもとめる最適な決定方式についても考察している。このように5年プロジェクトの初年度が終わった段階としては十分な達成度が得られたと考えている。

今後の研究の推進方策

25年度に得られた結果によって,単独の実データに対する結果だけではなく,現時点,世界で得られている相同なデータに対する結果にも対応することが可能になってきた。これより安定した予測性能が確かめられた幾つかの判別式の中から,さらに実用に向けて,研究を推進させる必要がある。
選ばれた共通なマーカーを持つデータセットに対して,表現型予測のためのパタ-ン認識,回帰分析を実行する。このためブースト・アルゴリズムを並行して走らせメタラーニングを行う。アルゴリズムは単に独立に走らせるのではなく各ステップで相互に学習結果を補正しあうことを考える。
このように各々のブースト・アルゴリズムに対してアップデートで結合する複数個のマーカーをプールしておき,その中で並列しているアルゴリズムで結合するマーカーが異なる場合には正則化によるペナルティを課し,できるだけ共通なマーカーを結合することが可能な学習則を構築する。そして得られたm 個の判別式には相似性があり,どのデータセットに対しても安定した予測性能を持つ。これをテスト用に取ってあったデータを使って検証する。
最近の研究で,表現形によって予測のための特徴パターンが大きく異なることが分かった。ターゲットにする表現形は,薬剤奏功性なのか,予後なのかで,予測解析も異なることになる。このような点を中心に,がん研究会,国立がんセンターの医学専門家の協力体制のもと,総合的に検討し,個別化医療のための予測キットの実用化を検討する。このようにして得られた成果を,活発な展開が成されている次世代シーケンサーの研究との関連からも模索する。

次年度の研究費の使用計画

総合的ディスカッションを予定していたウォーリック大学(UK)のJ.Copas教授が、スケジュール調整がつかず来日できなかったため。
2014年9月21日から9月26日に開催される"The thirty threeth International Workshop on Bayesian Inference and Maximum Entropy Methods in Science and Engineering"で、江口と小森がこれまでの研究成果の発表を行う予定であるが、遠方(フランス・アンボワーズ)で多額の費用が見込まれるため、昨年度生じた未使用額を合わせてこれに充てる。

  • 研究成果

    (28件)

すべて 2014 2013

すべて 雑誌論文 (19件) (うち査読あり 18件) 学会発表 (8件) (うち招待講演 1件) 図書 (1件)

  • [雑誌論文] Development of detection method for novel fusion gene using GeneChip Exon Array2014

    • 著者名/発表者名
      Wada, Y., Matsuura, M., Sugawara, M., Ushijima, M., Miyata, S., Nagasaki, K., Noda, T. and Miki, Y.
    • 雑誌名

      Journal of Clinical Bioinformatics

      巻: 4 ページ: -

    • DOI

      10.1186/2043-9113-4-3

    • 査読あり
  • [雑誌論文] Incidence and predictor of invasive disease and nodal metastasis in preoperatively diagnosed ductal carcinoma in situ2014

    • 著者名/発表者名
      Osako, T., Iwase, T., Ushijima, M., Horii, R., Fukami, Y., Kimura, K., Matsuura, M. and Akiyama, F.
    • 雑誌名

      Cancer Science

      巻: 105 ページ: 576-582

    • DOI

      10.1111/cas.12381

    • 査読あり
  • [雑誌論文] The interaction of a single-nucleotide polymorphism with age on response to interferon-alpha and ribavirin therapy in female patients with hepatitis C infection2014

    • 著者名/発表者名
      Nishino, J., Sugiyama, M., Nishida, N., Tokunaga, K., Mizokami, M. and Mano, S.
    • 雑誌名

      Journal of Medical Virology

      巻: 86 ページ: 1130-1133

    • DOI

      10.1002/jmv.23939

    • 査読あり
  • [雑誌論文] Spontaneous clustering via minimum gamma-divergence2014

    • 著者名/発表者名
      Notsu, A., Komori, O. and Eguchi, S
    • 雑誌名

      Neural Computation

      巻: 26 ページ: 421-448

    • DOI

      10.1162/NECO_a_00547

    • 査読あり
  • [雑誌論文] Distinct cancer-specific survival in metastatic prostate cancer patients classified by a panel of single nucleotide polymorphisms of cancer-associated genes2013

    • 著者名/発表者名
      Tsuchiya, N., Matsui, S., Narita, S., Kamba, T., Mitsuzuka, K., Hatakeyama, S., Horikawa, Y., Inoue, T., Saito, S., Ohyama, C., Arai, Y., Ogawa, O. and Habuchi, T.
    • 雑誌名

      Genes Cancer

      巻: 4 ページ: 54-60

    • DOI

      10.1177/1947601913481354

    • 査読あり
  • [雑誌論文] Telomere Shortening in the Esophagus of Japanese Alcoholics: Relationships with Chromoendoscopic Findings, ALDH2 and ADH1B Genotypes and Smoking History2013

    • 著者名/発表者名
      Aida, J., Yokoyama, A., Shimomura, N., Nakamura, K., Ishikawa, N., Terai, M., Poon, S., Matsuura, M., Fujiwara, M., Sawabe, M., Arai, T. and Takubo, K.
    • 雑誌名

      PLoS One

      巻: 8 ページ: 1-7

    • DOI

      10.1371/journal.pone.0063860

    • 査読あり
  • [雑誌論文] Empirical Bayes ranking and selection methods via semi-parametric hierarchical mixture models in microarray studies2013

    • 著者名/発表者名
      Noma, H. and Matsui, S.
    • 雑誌名

      Statistics in Medicine

      巻: 32 ページ: 1904-1916

    • DOI

      10.1002/sim.5718

    • 査読あり
  • [雑誌論文] ポストゲノム時代に遺伝疫学を考える (総説)2013

    • 著者名/発表者名
      間野修平
    • 雑誌名

      生物の科学 遺伝

      巻: 67 ページ: 368-371

  • [雑誌論文] Nested case control study of proteomic biomarkers for interstitial lung disease in Japanese patients with non-small-cell lung cancer treated with erlotinib: a multicenter phase IV study (JO21661)2013

    • 著者名/発表者名
      Atagi, S., Katakami, N., Yoshioka, H., Fukuoka, M., Kudoh, S., Ogiwara, A., Imai, M., Ueda, M. and Matsui, S.
    • 雑誌名

      Clin Lung Cancer

      巻: 14 ページ: 407-417

    • DOI

      10.1016/j.cllc.2012.12.006

    • 査読あり
  • [雑誌論文] Robust independent component analysis via minimum gamma-divergence estimation2013

    • 著者名/発表者名
      Chen, P-W., Hung, H., Komori, O., Huang, S-Y. and Eguchi, S.
    • 雑誌名

      IEEE Journal of Selected Topics in Signal Processing

      巻: 7 ページ: 614-624

    • DOI

      10.1109/JSTSP.2013.2247024

    • 査読あり
  • [雑誌論文] Geometry on positive definite matrices induced from V-potential function2013

    • 著者名/発表者名
      Ohara, A. and Eguchi, S.
    • 雑誌名

      Geometric Science of Information. Lecture Notes in Computer Science

      巻: 8085 ページ: 621-629

    • DOI

      10.1007/978-3-642-40020-9_69

    • 査読あり
  • [雑誌論文] Group invariance of information geometry on q-Gaussian distributions induced by beta-divergence2013

    • 著者名/発表者名
      Ohara, A. and Eguchi, S.
    • 雑誌名

      Entropy

      巻: 15 ページ: 4732-4747

    • DOI

      10.3390/e15114732

    • 査読あり
  • [雑誌論文] The number of candidate variants in exome sequencing for Mendelian disease under no genetic heterogeneity2013

    • 著者名/発表者名
      Nishino, J. and Mano, S.
    • 雑誌名

      Computational and Mathematical Methods in Medicine

      巻: 2013 ページ: -

    • DOI

      10.1155/2013/179761

    • 査読あり
  • [雑誌論文] Editorial note on special issue “Statistical Analysis of Biomarkers for Personalized Medicine”2013

    • 著者名/発表者名
      Eguchi, S., Matsui, S., Huang, S-Y. and Hsiao, C. K.
    • 雑誌名

      Computational and Mathematical Methods in Medicine

      巻: 2013 ページ: -

    • DOI

      10.1155/2013/467420

    • 査読あり
  • [雑誌論文] An Empirical Bayes Optimal Discovery Procedure Based on Semiparametric Hierarchical Mixture Models2013

    • 著者名/発表者名
      Noma, H. and Matsui, S.
    • 雑誌名

      Computational and Mathematical Methods in Medicine

      巻: 2013 ページ: -

    • DOI

      10.1155/2013/568480

    • 査読あり
  • [雑誌論文] Cancer outlier analysis based on mixture modeling of gene expression data2013

    • 著者名/発表者名
      Mori, K., Oura, T., Noma, H. and Matsui, S.
    • 雑誌名

      Computational and Mathematical Methods in Medicine

      巻: 2013 ページ: -

    • DOI

      10.1155/2013/693901

    • 査読あり
  • [雑誌論文] Detection of heterogeneous structures on the Gaussian copula model using projective power entropy2013

    • 著者名/発表者名
      Notsu, A., Kawasaki, Y. and Eguchi, S.
    • 雑誌名

      ISRN Probability and Statistics

      巻: 2013 ページ: -

    • DOI

      10.1155/2013/787141

    • 査読あり
  • [雑誌論文] Multiple suboptimal solutions for prediction rules in gene expression data2013

    • 著者名/発表者名
      Komori, O., Pritchard, M. and Eguchi, S.
    • 雑誌名

      Computational and Mathematical Methods in Medicine

      巻: 2013 ページ: -

    • DOI

      10.1155/2013/798189

    • 査読あり
  • [雑誌論文] Genomic biomarkers for personalized medicine: development and validation in clinical studies2013

    • 著者名/発表者名
      Matsui, S.
    • 雑誌名

      Computational and Mathematical Methods in Medicine

      巻: 2013 ページ: -

    • DOI

      10.1155/2013/865980

    • 査読あり
  • [学会発表] Possible generalization of MAXENT2014

    • 著者名/発表者名
      Eguchi, S.
    • 学会等名
      International symposium on innovation and challenges for fisheries assessment and management
    • 発表場所
      慶應義塾大学理工学部 矢上キャンパス,神奈川県
    • 年月日
      20140305-20140305
  • [学会発表] Pattern Recognition for Marine Ecological Assessments2013

    • 著者名/発表者名
      Eguchi, S.
    • 学会等名
      The Ninth ICSA International Conference: Challenges of Statistical Methods for Interdisciplinary Research and Big Data
    • 発表場所
      Hong Kong Baptist University, China
    • 年月日
      20131220-20131223
    • 招待講演
  • [学会発表] 情報幾何の展開―アダブーストからポアンカレ予想まで2013

    • 著者名/発表者名
      江口真透
    • 学会等名
      特別講演会
    • 発表場所
      千葉大学理学部,千葉県
    • 年月日
      20131115-20131115
  • [学会発表] 2値判別分析におけるモデルと推定の関係について2013

    • 著者名/発表者名
      江口真透
    • 学会等名
      科学研究費シンポジウム「一般化線形モデルの最新の展開とその周辺」
    • 発表場所
      千葉大学理学部,千葉県
    • 年月日
      20131109-20131109
  • [学会発表] Ancestral Processes with Collision and Bias2013

    • 著者名/発表者名
      Mano, S.
    • 学会等名
      Workshop on Coalescent Theory: New Developments and Applications
    • 発表場所
      Centre de Researches Mathematiques, Universite de Montreal, Montreal, Canada
    • 年月日
      20131010-20131010
  • [学会発表] The optimal discovery procedure in multiple significance testing: An empirical Bayes method based on semiparametric hierarchical mixture models2013

    • 著者名/発表者名
      野間久史, 松井茂之
    • 学会等名
      統計関連学会連合大会
    • 発表場所
      大阪大学,大阪府
    • 年月日
      20130911-20130911
  • [学会発表] 海洋生態系を測るための関数データ解析2013

    • 著者名/発表者名
      江口真透
    • 学会等名
      統計関連学会連合大会
    • 発表場所
      大阪大学,大阪府
    • 年月日
      20130910-20130910
  • [学会発表] A class of u-statistics combining multiple markers for two-group classification2013

    • 著者名/発表者名
      Komori, O., Hung, H., Chen, P., Huang, Su-Yun and Eguchi, S.
    • 学会等名
      Joint Meeting of the IASC Satellite Conference for the 59th ISI WSC and the 8th Conference of the Asian Regional Section of the IASC
    • 発表場所
      Seoul, Korea
    • 年月日
      20130823-20130823
  • [図書] Gene screening in the development of genomic signatures. in Design and Analysis of Clinical Trials for Predictive Medicine2014

    • 著者名/発表者名
      Noma, H. and Matsui, S. (Matsui, S., Buyse, M. and Simon, R. (eds.), Boca Raton)
    • 総ページ数
      425 ( - )
    • 出版者
      Chapman and Hall/CRC

URL: 

公開日: 2015-05-28   更新日: 2022-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi