2018 Fiscal Year Annual Research Report
Revised Algorithm for Maximal Analogies
Project/Area Number |
16K00291
|
Research Institution | Hokkaido University |
Principal Investigator |
原口 誠 北海道大学, 情報科学研究科(離職済), 特任教授(離職済) (40128450)
|
Co-Investigator(Kenkyū-buntansha) |
大久保 好章 北海道大学, 情報科学研究科, 助教 (40271639)
吉岡 真治 北海道大学, 情報科学研究科, 教授 (40290879)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 極大類比 / 擬似クリーク / 局所相関推論 / 非負行列分解 / グラフ正則化項 / アナロジカルヒント / クロスクラスタ― |
Outline of Annual Research Achievements |
物語や判例等の複数対象領域間で成り立つ類比を求める問題に対し,本研究では, (1) 個体(名詞等)間のマッチングという積空間での操作ではなく,個体の和集合で領域に跨る「クロスクラスタ―」をまず求め,(2) クロスクラスタ―を汎化イベントにおける「抽象的な個体」と見做すことにより,従来手法と比較し格段の処理性能を持つアルゴリズムを設計・実装・検証することを研究目的とした. まず (1) に関しては,2年目において設計・開発した手法,すなわち,2つの異なる行列を跨いで成立する属性間の局所相関を推論する手法を本研究用に拡張した.ただし,本研究用の行列では行に動詞と格(ロール)の対,列(属性)に複数文書における名詞をとり,動詞における振舞いが類似した列をヒントとして例示した上で,ヒントと整合的な列の局所相関を求める.実際に判例文書群に対し実験を行い,その効果を確認した. 次に,(2) に関しては,2年目においては形式概念を用いて結束性の高い汎化イベントを求める処理を想定したが,計算論的に負荷が大となる傾向にあり,また,処理自体複雑になる難点があったために,よりシンプルな方式の設計を試みた.具体には,クロスクラスタ―から直ちに得られる原始パターンの組合わせに構文的制約を課した擬似クリークの中で,一定数の領域で実現可能なものを求める.擬似クリークとしては連鎖からクリークまで幅広く表現できる k-Plex を採用し,本研究用に拡張した 極大 k-CPlex のマイニングにより極大類比を求めるアルゴリズムの設計と(理論的)検証を完了させた. 実装実験を研究期間内に完了できなった点は遺憾だが,本研究で明らかにした手法はスター構造スキーマのファクトテーブル群に対しても広く適用可能であることも考慮し,今後も個人(申請資格喪失者)として研究開発を続行し成果を社会に還元する予定である.
|