研究課題/領域番号 |
24300054
|
研究機関 | 京都大学 |
研究代表者 |
馬見塚 拓 京都大学, 化学研究所, 教授 (00346107)
|
研究期間 (年度) |
2012-04-01 – 2016-03-31
|
キーワード | グラフマイニング |
研究実績の概要 |
本研究では、ラベル伝搬とリンク予測を統合的に一つの問題として捉え解決する手法の構築を試みた。この2つの問題はリンクとノードを置き換えた場合に同一の問題となり、これまで培われてきたラベル伝搬とリンク予測の手法を一般的に包括する枠組みを考えることができる。このような一般的な枠組みを定義するとともに、ラベル伝搬とリンク予測それぞれの状況に即した有効な手法を構築・提案した。例えば、リンク予測に関しては、グラフの特性から潜在するリンクの周辺情報をカーネルの枠組みで把握することにより学習・予測する手法を構築した。この手法は、統合的な枠組み由来であるため、確率モデルによる非常に有名なリンク予測手法に比べ、はるかに精度が高くまた効率的である。また、ラベル伝搬に関しては、複数グラフが利用できる局面が多いため、複数グラフが与えられ利用可能という設定において、ラベル伝搬に有効なグラフをスパースに選択しつつ学習する枠組みを構築・提案した。 また、一般的な枠組みからさらに考察を進め、ラベル伝搬やリンク予測を効率的に行うためには、グラフの特性そのものを精密に把握する試みが欠かせない。このため、グラフの特性を考慮しつつ、与えらた行列データからグラフを構築するグラフ構成の枠組みおいて、データに内在する特徴をより精緻に捉えつつ、グラフを効率的に構成する手法を開発し、グラフクラスタリングやラベル伝搬での実際の有効性を検証した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
実績概要に記述の通り成果を挙げつつあるため。
|
今後の研究の推進方策 |
この研究を推進する上で、グラフ内のノード間の距離の定義が重要な役割を果たすことから、diffusion kernelといった既存距離を含む一般的な距離を定義し、特別な場合の解析を行った。さらに、グラフクラスタリングに対して、新しく定義した距離の有効性を検証した。今後、グラフ間のノード間距離を柔軟に定義可能であると同時に、効率的に計算できるような手法を構築・提案していく予定である。
|
次年度使用額が生じた理由 |
最終年度に研究成果のまとめをソフトウェアやウェブツールとして提供する予定であったが、手法構築、実験、論文のまとめ等に集中したため、そこまで終了できず、それらの目的で用意した費用が未使用額として発生した。
|
次年度使用額の使用計画 |
平成26年度に終了できなかった成果のまとめを行うために未使用額を充てる予定である。内訳は、まとめのために研究補助員の雇用(3,000千円)、ウェブサーバ等の物品費(178.795千円)、成果発表のための海外出張旅費(300千円)、成果発表を行う雑誌論文のOpen Access Fee(300千円)である。
|
備考 |
烏山昌幸助教、馬見塚拓教授の研究チームが、生命科学の重要な問題を解決するコンペティションの中で最も有名なDREAMチャレンジの遺伝子エッセンシャリティー予測において予測精度第1位を達成し表彰を受けました:Best Performer in the DREAM 9 Broad-DREAM Gene Essentiality Prediction Challenge Sub-Challenge 1
|