2012 Fiscal Year Annual Research Report
機械学習アルゴリズムのための最適グラフ構成法に関する研究
Project/Area Number |
24800036
|
Research Institution | Kyoto University |
Principal Investigator |
烏山 昌幸 京都大学, 化学研究所, 助教 (40628640)
|
Project Period (FY) |
2012-08-31 – 2014-03-31
|
Keywords | 機械学習 / グラフ / バイオインフォマティクス |
Research Abstract |
本研究はグラフに基づく機械学習アルゴリズムに関するものであり,特にグラフ上でのラベル推定問題に関して取り組むものである.例えばタンパク質相互作用ネットワーク上での機能予測問題ではグラフのノードが一つのタンパク質であり,それぞれのタンパク質の持つ生物学的機能を予測する.タンパク質の機能はいくつかのカテゴリが知られており,それらをラベルとして機能既知のタンパク質から未知のタンパク質のラベル(機能)を推定する.データの種類が多様化するなかで,複雑な構造を表現するためのグラフという手段は非常に強力でありこのような問題の重要性が増している. グラフ上での推定問題はすでに広く扱われてきたが,近年の計測技術の発展に伴い一つの予測問題に対して複数のグラフが得られることが一般的になってきた.そこで本研究では与えられた複数のグラフを結合し,より高精度にラベル推定を行う手法の開発を行った.特に提案法では複数グラフの中に予測にとって不要なものが含まれている場合を想定し,予測に有益なグラフを選び出し結合する手法の開発をおこなった.実践的には様々な情報が得られる中でどれが真に有用ななのか分からない場合がほとんであるため,これは非常に重要な特徴となる.また,実際にタンパク質の機能予測データを用いて精度の実証も行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題はグラフに基づく推定問題において入力となるグラフをどのように生成するかに関して着目するものであり,当初には2つの大項目として複数グラフの結合問題と数値データからのグラフ推定問題を掲げた.昨年度はおもに前者のグラフ結合問題について取り組み,おおむね当初の予定通りにアルゴリズムを設計し,既存法を上回る精度を検証することができた.また成果については国内の機械学習の研究会(情報論的学習理論と機械学習研究会)で発表を行うとともに,国際論文誌にも投稿を行っている(現在査読中).以上の観点から,当初の研究計画に合う程度従って研究を進行することができていると考えている.
|
Strategy for Future Research Activity |
今年度は2つ目の課題項目であった数値データからのグラフ推定について主に取り組む.データのもつ相互関係に着目する場合に数値データをグラフとして表現することがしばしば行われる.例えば,遺伝子発現データにおいて相関の高い遺伝子は共発現遺伝子と呼ばれ機能的に何らかの相互作用を行っていると推定する場合がある.そのような場合データのグラフ表現はデータに潜む関係性を表現する手段として頻繁に用いられる.昨年度に引き続き本研究ではグラフ上の推定問題に着目するため,最終的な推定精度の向上に寄与するような数値データグラフ変換法を考える.多くの既存の手法では調節の難しいパラメータが出現することが多く,実験者の経験と試行錯誤によって設定されることが多く,これが精度を悪化する場合がある.ここでは入力数値データの構造を捉えるようなパラメータを自動に推定することでそのような問題を持たない手法の設計を目指す.現在アルゴリズムのプロトタイプを設計し国内研究会(情報論的学習理論と機械学習研究会)において中間的な成果を発表した.より大規模な実験検証を行い国際会議,国際論文への今年度の投稿を予定している.
|
Research Products
(2 results)