2011 Fiscal Year Annual Research Report
グラフ構造データの予測的分析のための機械学習手法の研究
Project/Area Number |
22680012
|
Research Institution | The University of Tokyo |
Principal Investigator |
鹿島 久嗣 東京大学, 大学院・情報理工学系研究科, 准教授 (80545583)
|
Keywords | 機械学習 / データマイニング / グラフ / 木 |
Research Abstract |
23年度は22年度に引き続き、グラフ構造をもったデータに対する予測モデル化についての基礎的な方法論の確立に注力し、いくつかの研究成果をあげるとともに、グラフデータに対する機械学習が他分野において認知され、また利用されるよう積極的なアウトリーチ活動を行った。 まず、グラフ構造に対する一般的なモデルとして、条件付き確率場(CIF)と呼ばれるモデルが知られているが、我々はデータの形式が配列構造をもつときにきわめて高速に、かつ安定してモデル推定を行うことのできる手法を開発した。その成果は人工知能分野の最高峰会議であるAAAIにおいて発表された。 また、データ同志の類似度の定義とその効率的な計算は機械学習手法における基本であるが、我々は木同志の類似度を含まれる縦方向の部分構造によって定義し、これを線形時間で計算できる方法を開発し、木構造データに対する高精度で効率的な予測手法を実現した。これは実践的な有用性のみならず、計算時間が最悪線形時間であることを示したという、理論的な面でのインパクトも大きい。この研究成果は国内の会議(IBIS2011)において発表されたのち、機械学習分野の最高峰会議において(2012/05/1現在において)採択が決定している。 また、言語処理学会年次大会におけるチュートリアル講演など2件の招待講演と、書籍の項目執筆を行うなど、グラフ構造をもったデータ構造に対する機械学習法の啓蒙活動も積極的に行った。 また、22年度の研究成果の一部である以下の国内研究会発表が情報処理学会山下記念研究賞を受賞した 鹿島久嗣,山西芳裕,加藤毅,杉山将,津田宏治 複数生物種ネットワークの同時予測:半教師つき学習によるアプローチ 第21回情報処理学会バイオ情報学研究会(SIG-BIO), Vo1. 2010-BIO-21, No.19, 2010.)
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
木構造をもったデータの解析を高精度で、かつ理論的にも実際的にも高速に行うことのできる方法を開発するなど、順調に研究成果が出ている。
|
Strategy for Future Research Activity |
配列や木といった構造をもったデータに対する極めて効率の良い予測モデル構築手法により大きく力を入れる。また一般的なグラフ構造をもったデータについてもこれらの方法を拡張するとともに、応用分野への適用にも力を入れる。
|