研究概要 |
23年度は22年度に引き続き、グラフ構造をもったデータに対する予測モデル化についての基礎的な方法論の確立に注力し、いくつかの研究成果をあげるとともに、グラフデータに対する機械学習が他分野において認知され、また利用されるよう積極的なアウトリーチ活動を行った。 まず、グラフ構造に対する一般的なモデルとして、条件付き確率場(CIF)と呼ばれるモデルが知られているが、我々はデータの形式が配列構造をもつときにきわめて高速に、かつ安定してモデル推定を行うことのできる手法を開発した。その成果は人工知能分野の最高峰会議であるAAAIにおいて発表された。 また、データ同志の類似度の定義とその効率的な計算は機械学習手法における基本であるが、我々は木同志の類似度を含まれる縦方向の部分構造によって定義し、これを線形時間で計算できる方法を開発し、木構造データに対する高精度で効率的な予測手法を実現した。これは実践的な有用性のみならず、計算時間が最悪線形時間であることを示したという、理論的な面でのインパクトも大きい。この研究成果は国内の会議(IBIS2011)において発表されたのち、機械学習分野の最高峰会議において(2012/05/1現在において)採択が決定している。 また、言語処理学会年次大会におけるチュートリアル講演など2件の招待講演と、書籍の項目執筆を行うなど、グラフ構造をもったデータ構造に対する機械学習法の啓蒙活動も積極的に行った。 また、22年度の研究成果の一部である以下の国内研究会発表が情報処理学会山下記念研究賞を受賞した 鹿島久嗣,山西芳裕,加藤毅,杉山将,津田宏治 複数生物種ネットワークの同時予測:半教師つき学習によるアプローチ 第21回情報処理学会バイオ情報学研究会(SIG-BIO), Vo1. 2010-BIO-21, No.19, 2010.)
|