• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

複雑かつ大規模なデータ処理のためのデータマイニング及び機械学習法

Research Project

Project/Area Number 24700140
Research InstitutionTokyo Institute of Technology

Principal Investigator

田部井 靖生  東京工業大学, 情報理工学(系)研究科, 東工大特別研究員 (20589824)

Keywordsアルゴリズム / 機械学習 / ビッグデータ
Research Abstract

平成25年度は当初計画していた(i)大規模ネットワークの検索, (ii)コンパクトなデータ表現の応用において成果を上げることに成功した. (i)に関しては, 簡潔データ構造の一種であるウェーブレット木上で2次元区間検索を行なうことで高速に行うアルゴリズムを設計した. 本検索手法の応用として大規模化合物-タンパク質相互作用の検索が上げられる. 薬はいくつかのタンパク質と相互作用する化合物であり, 提案手法を応用させることにより, クエリーに対する薬の候補を検索することが可能となる. 約200万化合物-タンパク質相互作用からなるデータセットに適応し, 他の既存検索手法よりも高速であることが示すことに成功している. 提案手法に関する論文はデータマイニングのトップ会議KDD2014に採択された.
(ii)に関しては, 超高次元フィンガープリントをJaccard-Tanimoto類似度をハミング距離で近似的に保存したまま低次元空間へハッシュするminhashを化合物-タンパク質相互作用予測へ応用した. オリジナルのminhashはハッシュされた1要素当たり64ビットかかってしまうが、精度を落とすことなく64ビットより小さいハッシュ値に改良を行った. これにより大規模データに対しても適応することができる. 提案手法をサポートベクターマシンの入力として使うことで, 約一千万化合物-タンパク質相互作用のデータからでも効率的に学習を行なうことができる. 本手法に関する論文はバイオインフォマティクスの国際会議GIW2014に採択された.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初計画した成果を上げることができたため.

Strategy for Future Research Activity

平成26年度は, これまで開発した手法を産業利用, 主に創薬の場面で使っていただけるよう活動を行っていく.

Expenditure Plans for the Next FY Research Funding

納期の遅れにより計算機が年度内に購入できなかったため。
26年度のはじめに前年度購入できなかった計算機を購入予定。

  • Research Products

    (2 results)

All 2013

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (1 results)

  • [Journal Article] Scalable prediction of compound-protein interactions using minwise hashing2013

    • Author(s)
      Y.Tabei and Y.Yamanishi
    • Journal Title

      BMC Systems Biology

      Volume: 7 Pages: S3

    • DOI

      10.1186/1752-0509-7-S6-S3

    • Peer Reviewed
  • [Presentation] Succinct Interval-Splitting Tree for Scalable Similarity Search of Compound-Protein Pairs with Property Constraints2013

    • Author(s)
      Y.Tabei, A.Kishimoto, M.Kotera, Y.Yamanishi
    • Organizer
      19th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD2013)
    • Place of Presentation
      シカゴ
    • Year and Date
      20130810-20130814

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi