2009 Fiscal Year Annual Research Report
内包に基づくカーネルによる構造データ学習と知識発見
Project/Area Number |
20700135
|
Research Institution | The University of Tokyo |
Principal Investigator |
土井 晃一郎 The University of Tokyo, 大学院・新領域創成科学研究科, 特任講師 (10345126)
|
Keywords | 機械学習 / 知識発見 / 構造データ / カーネル関数 |
Research Abstract |
本年度は前年度までの申請者による内包カーネル関数に関する成果に基づき、更なる拡張を試みた。RNA配列に対して、今までの我々の内包カーネル関数で考慮していなかったシュードノット構造を考慮するようにすべく修正を行ったが、パラメーラが多くなってしまい、現実のデータにはうまく適用できないと考えている。この点に関しては更なる研究が必要である。更に新たな実データに対する内包カーネル関数の適用を試みているが,まだここで報告できるような形まで至っていない。具体的にはXMLのような木構造やWEBのリンクなどのグラフ構造やRNA配列に対しても違った定式化を試みている。この点に関しては来年度に引き続いて研究を行っていく予定である。畳み込みカーネルなどの他のカーネル関数の設計手法とも性能比較を行っているが、定性的な違いを明確に出せていない。計算量や他手法との比較に関しても研究を行っていく予定である。これらの研究を通して部分構造だけではない構造データに対する特徴づけを提示していきたいと考えている。また、この研究成果を英語論文にまとめて雑誌に投稿中である。 また、上記の研究と並行して、構造データ学習への新たなアプローチとして、木構造に適した圧縮を施すことにより頻出する木パターン発見の計算の高速化を行えることを前年度に示している。本年度はこの成果を更に拡張して、今までは根付き順序木だけに対して示していたのであるが、根付き無順序木に対しても我々の手法の適用が行えるようにして、同様に高速化が行えることを示している。この圧縮では内包カーネル関数で重要な役割を果たす構造データを生成する文法を利用していて、内包カーネル関数の設計とも密接に関わる研究である。この研究に関して、国内で学会発表を行い、更に雑誌に論文を投稿中である。
|
Research Products
(1 results)