2008 Fiscal Year Annual Research Report
Project/Area Number |
20500126
|
Research Institution | Gakushuin University |
Principal Investigator |
久保山 哲二 Gakushuin University, 計算機センター, 准教授 (80302660)
|
Keywords | 機械学習 / カーネル法 / 木構造 / 類似度 / 距離関数 |
Research Abstract |
文字列、木構造、グラフ構造などの離散データ構造を対象とした分類学習のための要素技術として、二つの構造間の類似度関数(カーネル関数)を系統的に設計するための手法について、重点的に研究を行った。まず、ノードにラベルのついた根付き木について、子供のノード間に順序のない、いわゆる無順序木の間のカーネル関数を設計した。無順序間の一般的な木カーネルについては、2007年に鹿島・坂本・小柳によって、その計算困難性が指摘されていたが、本研究では、二つの木構造間に共通に含まれる二分木構造を効率よく数え上げることによって、この問題に対処し、カーネル関数を計算する高速なアルゴリズムを提案した。 また、従来研究で申吉浩と木構造に対して開発した新しいカーネル関数の設計手法であるマッピングカーネルのフレームワークを、木構造に限定しない一般的な形に拡張した。これにより、離散データ構造のカーネル設計として現在もっとも一般的なHausslerの畳み込みヌーネルの設計条件を緩和し、より一般的なフレームワークを構築した。 順序木については、二つの木構造間の標準的な編集距離アルゴリズムとして、木構造の大きさの3乗オーダーの計算量をもつアルゴリズムが知られている。本研究では、木構造を文字列にコーディングすることにより、木構造間の編集距離を文字列間の編集距離で近似するアルゴリズムを提案した。
|