• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

ゲノム・オミックスデータ解析の安定化のための統計的方法論

Research Project

Project/Area Number 25280008
Research Category

Grant-in-Aid for Scientific Research (B)

Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

江口 真透  統計数理研究所, 大学共同利用機関等の部局等, 教授 (10168776)

Co-Investigator(Kenkyū-buntansha) 松浦 正明  帝京大学, 公衆衛生学研究科, 教授(Professor) (40173794)
松井 茂之  名古屋大学, 医学(系)研究科(研究院), 教授 (80305854)
間野 修平  統計数理研究所, 数理・推論研究系, 准教授 (20372948)
野間 久史  統計数理研究所, 大学共同利用機関等の部局等, 助教 (70633486)
小森 理  統計数理研究所, 大学共同利用機関等の部局等, 特任助教 (60586379)
Project Period (FY) 2013-04-01 – 2018-03-31
Keywords遺伝子発現 / クラスター / 乳がんデータ / 個人化治療 / 効果予測
Research Abstract

遺伝子発現解析で起こる超高次元・小標本の状況における予測性能の安定化のための統計的方法論の開発について,集中的な研究を行った.その開発のため,計算プログラミングの研究補助員に予算を重点配分し,クラスタリングによるマーカー選択の方法の完成を第一に目指した。
これは,従来,情報のあるマーカー選択は,単独マーカーの性能(2標本検定のP 値)のランキングやホールドチェンジによるフィルタリングによって決めていたが,このやり方がデータごとに変動し不安定な挙動を示すことから,その解決策として考えたものである。すなわち,このマーカー選択によって予測解析を行うとよい性能が得られないのは,訓練データとテストデータのランキングやフィルタリングが大きく食い違うためであると考え,従来法と全く発想の違う観点からの選択法を提案したものであり,クラスタリングされたマーカーのクラスター構造が変動しないように,マーカーの選択を逐次減少法によって行うものである。
具体的には,全てのマーカーにk-平均法を行い,k 個のクラスターに分類した。ここでクラスター数k はサブタイプの情報から決めた。例えば乳がんデータにおいては4つのサブタイプが報告されているが,これに対して,マーカーの属するクラスターをクラスラベルと定義して,k-クラスのパタ-ン認識をフィッシャー線形判別によって予測し,このクラスターの構造が変わらないようにする変数(遺伝子)選択法を構築し,特にk平均法に変わる自発クラスタリングを開発した。これはクラスター数を自動的に推定できるアルゴリズムで,一般的な内容で論文発表したが,この問題に適用するために実験的に予備解析を行った。
12月,香港の国際会議の参加の際にアカデミア・シニカのS-Y. Huang 教授とクラスタリングについて総合的なディスカッションを行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度を終えた段階であるが,「LASSO クラスタリングによる開発」は実用化のレベルに到達した。これは膨大なマーカーの中から情報のあるマーカーを選択する,従来の方法に代わる新たな方法として有用であると思われる。
教師なし学習の内容で開発されたこの方法は,予めクラスター法を決めないで,データごとに適切に求める「自発クラスタリング」であり,これについても,ある程度実用化の目途がついた。また,一般的な機械学習の方法として開発されたロバスト独立成分の方法やAUC最大化による表現型予測の方法も,このプロジェクトで実用化を図りたい。
データベースGEO や過去の共同研究で得られたデータの,対象ごとに分類されたデータセットに対して,LASSO クラスタリングのマーカー選択法を適用してマーカーの候補を用意する.これらのデータセットの重みを決める方法については,未だ本格的な研究には着手していないが,予備的なデータの加工などについては開始されている。
次に 候補に選ばれたマーカーのゲノム・遺伝子・分子の特性情報を援用しての適切な絞り込みについても,最近の文献を調査している。また,データセットに共通なマーカーを決定し,ターゲットのデータセットにつけられた重みをもとめる最適な決定方式についても考察している。このように5年プロジェクトの初年度が終わった段階としては十分な達成度が得られたと考えている。

Strategy for Future Research Activity

25年度に得られた結果によって,単独の実データに対する結果だけではなく,現時点,世界で得られている相同なデータに対する結果にも対応することが可能になってきた。これより安定した予測性能が確かめられた幾つかの判別式の中から,さらに実用に向けて,研究を推進させる必要がある。
選ばれた共通なマーカーを持つデータセットに対して,表現型予測のためのパタ-ン認識,回帰分析を実行する。このためブースト・アルゴリズムを並行して走らせメタラーニングを行う。アルゴリズムは単に独立に走らせるのではなく各ステップで相互に学習結果を補正しあうことを考える。
このように各々のブースト・アルゴリズムに対してアップデートで結合する複数個のマーカーをプールしておき,その中で並列しているアルゴリズムで結合するマーカーが異なる場合には正則化によるペナルティを課し,できるだけ共通なマーカーを結合することが可能な学習則を構築する。そして得られたm 個の判別式には相似性があり,どのデータセットに対しても安定した予測性能を持つ。これをテスト用に取ってあったデータを使って検証する。
最近の研究で,表現形によって予測のための特徴パターンが大きく異なることが分かった。ターゲットにする表現形は,薬剤奏功性なのか,予後なのかで,予測解析も異なることになる。このような点を中心に,がん研究会,国立がんセンターの医学専門家の協力体制のもと,総合的に検討し,個別化医療のための予測キットの実用化を検討する。このようにして得られた成果を,活発な展開が成されている次世代シーケンサーの研究との関連からも模索する。

Expenditure Plans for the Next FY Research Funding

総合的ディスカッションを予定していたウォーリック大学(UK)のJ.Copas教授が、スケジュール調整がつかず来日できなかったため。
2014年9月21日から9月26日に開催される"The thirty threeth International Workshop on Bayesian Inference and Maximum Entropy Methods in Science and Engineering"で、江口と小森がこれまでの研究成果の発表を行う予定であるが、遠方(フランス・アンボワーズ)で多額の費用が見込まれるため、昨年度生じた未使用額を合わせてこれに充てる。

  • Research Products

    (28 results)

All 2014 2013

All Journal Article (19 results) (of which Peer Reviewed: 18 results) Presentation (8 results) (of which Invited: 1 results) Book (1 results)

  • [Journal Article] Development of detection method for novel fusion gene using GeneChip Exon Array2014

    • Author(s)
      Wada, Y., Matsuura, M., Sugawara, M., Ushijima, M., Miyata, S., Nagasaki, K., Noda, T. and Miki, Y.
    • Journal Title

      Journal of Clinical Bioinformatics

      Volume: 4 Pages: -

    • DOI

      10.1186/2043-9113-4-3

    • Peer Reviewed
  • [Journal Article] Incidence and predictor of invasive disease and nodal metastasis in preoperatively diagnosed ductal carcinoma in situ2014

    • Author(s)
      Osako, T., Iwase, T., Ushijima, M., Horii, R., Fukami, Y., Kimura, K., Matsuura, M. and Akiyama, F.
    • Journal Title

      Cancer Science

      Volume: 105 Pages: 576-582

    • DOI

      10.1111/cas.12381

    • Peer Reviewed
  • [Journal Article] The interaction of a single-nucleotide polymorphism with age on response to interferon-alpha and ribavirin therapy in female patients with hepatitis C infection2014

    • Author(s)
      Nishino, J., Sugiyama, M., Nishida, N., Tokunaga, K., Mizokami, M. and Mano, S.
    • Journal Title

      Journal of Medical Virology

      Volume: 86 Pages: 1130-1133

    • DOI

      10.1002/jmv.23939

    • Peer Reviewed
  • [Journal Article] Spontaneous clustering via minimum gamma-divergence2014

    • Author(s)
      Notsu, A., Komori, O. and Eguchi, S
    • Journal Title

      Neural Computation

      Volume: 26 Pages: 421-448

    • DOI

      10.1162/NECO_a_00547

    • Peer Reviewed
  • [Journal Article] Distinct cancer-specific survival in metastatic prostate cancer patients classified by a panel of single nucleotide polymorphisms of cancer-associated genes2013

    • Author(s)
      Tsuchiya, N., Matsui, S., Narita, S., Kamba, T., Mitsuzuka, K., Hatakeyama, S., Horikawa, Y., Inoue, T., Saito, S., Ohyama, C., Arai, Y., Ogawa, O. and Habuchi, T.
    • Journal Title

      Genes Cancer

      Volume: 4 Pages: 54-60

    • DOI

      10.1177/1947601913481354

    • Peer Reviewed
  • [Journal Article] Telomere Shortening in the Esophagus of Japanese Alcoholics: Relationships with Chromoendoscopic Findings, ALDH2 and ADH1B Genotypes and Smoking History2013

    • Author(s)
      Aida, J., Yokoyama, A., Shimomura, N., Nakamura, K., Ishikawa, N., Terai, M., Poon, S., Matsuura, M., Fujiwara, M., Sawabe, M., Arai, T. and Takubo, K.
    • Journal Title

      PLoS One

      Volume: 8 Pages: 1-7

    • DOI

      10.1371/journal.pone.0063860

    • Peer Reviewed
  • [Journal Article] Empirical Bayes ranking and selection methods via semi-parametric hierarchical mixture models in microarray studies2013

    • Author(s)
      Noma, H. and Matsui, S.
    • Journal Title

      Statistics in Medicine

      Volume: 32 Pages: 1904-1916

    • DOI

      10.1002/sim.5718

    • Peer Reviewed
  • [Journal Article] ポストゲノム時代に遺伝疫学を考える (総説)2013

    • Author(s)
      間野修平
    • Journal Title

      生物の科学 遺伝

      Volume: 67 Pages: 368-371

  • [Journal Article] Nested case control study of proteomic biomarkers for interstitial lung disease in Japanese patients with non-small-cell lung cancer treated with erlotinib: a multicenter phase IV study (JO21661)2013

    • Author(s)
      Atagi, S., Katakami, N., Yoshioka, H., Fukuoka, M., Kudoh, S., Ogiwara, A., Imai, M., Ueda, M. and Matsui, S.
    • Journal Title

      Clin Lung Cancer

      Volume: 14 Pages: 407-417

    • DOI

      10.1016/j.cllc.2012.12.006

    • Peer Reviewed
  • [Journal Article] Robust independent component analysis via minimum gamma-divergence estimation2013

    • Author(s)
      Chen, P-W., Hung, H., Komori, O., Huang, S-Y. and Eguchi, S.
    • Journal Title

      IEEE Journal of Selected Topics in Signal Processing

      Volume: 7 Pages: 614-624

    • DOI

      10.1109/JSTSP.2013.2247024

    • Peer Reviewed
  • [Journal Article] Geometry on positive definite matrices induced from V-potential function2013

    • Author(s)
      Ohara, A. and Eguchi, S.
    • Journal Title

      Geometric Science of Information. Lecture Notes in Computer Science

      Volume: 8085 Pages: 621-629

    • DOI

      10.1007/978-3-642-40020-9_69

    • Peer Reviewed
  • [Journal Article] Group invariance of information geometry on q-Gaussian distributions induced by beta-divergence2013

    • Author(s)
      Ohara, A. and Eguchi, S.
    • Journal Title

      Entropy

      Volume: 15 Pages: 4732-4747

    • DOI

      10.3390/e15114732

    • Peer Reviewed
  • [Journal Article] The number of candidate variants in exome sequencing for Mendelian disease under no genetic heterogeneity2013

    • Author(s)
      Nishino, J. and Mano, S.
    • Journal Title

      Computational and Mathematical Methods in Medicine

      Volume: 2013 Pages: -

    • DOI

      10.1155/2013/179761

    • Peer Reviewed
  • [Journal Article] Editorial note on special issue “Statistical Analysis of Biomarkers for Personalized Medicine”2013

    • Author(s)
      Eguchi, S., Matsui, S., Huang, S-Y. and Hsiao, C. K.
    • Journal Title

      Computational and Mathematical Methods in Medicine

      Volume: 2013 Pages: -

    • DOI

      10.1155/2013/467420

    • Peer Reviewed
  • [Journal Article] An Empirical Bayes Optimal Discovery Procedure Based on Semiparametric Hierarchical Mixture Models2013

    • Author(s)
      Noma, H. and Matsui, S.
    • Journal Title

      Computational and Mathematical Methods in Medicine

      Volume: 2013 Pages: -

    • DOI

      10.1155/2013/568480

    • Peer Reviewed
  • [Journal Article] Cancer outlier analysis based on mixture modeling of gene expression data2013

    • Author(s)
      Mori, K., Oura, T., Noma, H. and Matsui, S.
    • Journal Title

      Computational and Mathematical Methods in Medicine

      Volume: 2013 Pages: -

    • DOI

      10.1155/2013/693901

    • Peer Reviewed
  • [Journal Article] Detection of heterogeneous structures on the Gaussian copula model using projective power entropy2013

    • Author(s)
      Notsu, A., Kawasaki, Y. and Eguchi, S.
    • Journal Title

      ISRN Probability and Statistics

      Volume: 2013 Pages: -

    • DOI

      10.1155/2013/787141

    • Peer Reviewed
  • [Journal Article] Multiple suboptimal solutions for prediction rules in gene expression data2013

    • Author(s)
      Komori, O., Pritchard, M. and Eguchi, S.
    • Journal Title

      Computational and Mathematical Methods in Medicine

      Volume: 2013 Pages: -

    • DOI

      10.1155/2013/798189

    • Peer Reviewed
  • [Journal Article] Genomic biomarkers for personalized medicine: development and validation in clinical studies2013

    • Author(s)
      Matsui, S.
    • Journal Title

      Computational and Mathematical Methods in Medicine

      Volume: 2013 Pages: -

    • DOI

      10.1155/2013/865980

    • Peer Reviewed
  • [Presentation] Possible generalization of MAXENT2014

    • Author(s)
      Eguchi, S.
    • Organizer
      International symposium on innovation and challenges for fisheries assessment and management
    • Place of Presentation
      慶應義塾大学理工学部 矢上キャンパス,神奈川県
    • Year and Date
      20140305-20140305
  • [Presentation] Pattern Recognition for Marine Ecological Assessments2013

    • Author(s)
      Eguchi, S.
    • Organizer
      The Ninth ICSA International Conference: Challenges of Statistical Methods for Interdisciplinary Research and Big Data
    • Place of Presentation
      Hong Kong Baptist University, China
    • Year and Date
      20131220-20131223
    • Invited
  • [Presentation] 情報幾何の展開―アダブーストからポアンカレ予想まで2013

    • Author(s)
      江口真透
    • Organizer
      特別講演会
    • Place of Presentation
      千葉大学理学部,千葉県
    • Year and Date
      20131115-20131115
  • [Presentation] 2値判別分析におけるモデルと推定の関係について2013

    • Author(s)
      江口真透
    • Organizer
      科学研究費シンポジウム「一般化線形モデルの最新の展開とその周辺」
    • Place of Presentation
      千葉大学理学部,千葉県
    • Year and Date
      20131109-20131109
  • [Presentation] Ancestral Processes with Collision and Bias2013

    • Author(s)
      Mano, S.
    • Organizer
      Workshop on Coalescent Theory: New Developments and Applications
    • Place of Presentation
      Centre de Researches Mathematiques, Universite de Montreal, Montreal, Canada
    • Year and Date
      20131010-20131010
  • [Presentation] The optimal discovery procedure in multiple significance testing: An empirical Bayes method based on semiparametric hierarchical mixture models2013

    • Author(s)
      野間久史, 松井茂之
    • Organizer
      統計関連学会連合大会
    • Place of Presentation
      大阪大学,大阪府
    • Year and Date
      20130911-20130911
  • [Presentation] 海洋生態系を測るための関数データ解析2013

    • Author(s)
      江口真透
    • Organizer
      統計関連学会連合大会
    • Place of Presentation
      大阪大学,大阪府
    • Year and Date
      20130910-20130910
  • [Presentation] A class of u-statistics combining multiple markers for two-group classification2013

    • Author(s)
      Komori, O., Hung, H., Chen, P., Huang, Su-Yun and Eguchi, S.
    • Organizer
      Joint Meeting of the IASC Satellite Conference for the 59th ISI WSC and the 8th Conference of the Asian Regional Section of the IASC
    • Place of Presentation
      Seoul, Korea
    • Year and Date
      20130823-20130823
  • [Book] Gene screening in the development of genomic signatures. in Design and Analysis of Clinical Trials for Predictive Medicine2014

    • Author(s)
      Noma, H. and Matsui, S. (Matsui, S., Buyse, M. and Simon, R. (eds.), Boca Raton)
    • Total Pages
      425 ( - )
    • Publisher
      Chapman and Hall/CRC

URL: 

Published: 2015-05-28   Modified: 2022-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi