構造表現(語彙分解に基づく語彙知識),ネットワーク表現(語彙オントロジ),素性空間表現(分散表現)という異なる形式で表現された語彙知識を融合・高度化し,知識の相互運用を可能とすることを目指して研究を進めてきた.今年度は,(1)動詞を中心とした用言に着目し,2つの日本語語彙オントロジ,EDR概念辞書と述語項構造シソーラスのネットワーク構造(階層的分類)と,構造表現における主たる素性である使役性(自他性)との関係を分析した.(2)語彙オントロジの主たる構成要素である包摂関係(上位下位関係)やその他の意味関係が,分散表現においてどのように表現されているかについて検討をすすめた. (1) 本分析では,EDR概念辞書と述語項構造シソーラスの語義記述から,両者に共通(一対一対応)しかつ自他対応している語義の対(165対)を選び出し,それらのネットワーク構造中での位置関係を分析した.分析を通じて,他動詞語義の配置を上位構造と下位構造のどちらに基づいて行うか等のネットワーク知識の構成に関するポリシが明らかとなること,知識構築における作業ミスの発見など,異なる形式での表現を付き合わせることの有効性を示した.一方で,いわゆる自他対応が必ずしも一つの意味関係と対応していないなど意味記述の難しさも明らかとなった. (2)単語の意味関係特に包摂関係は,ネットワーク表現の背骨であるが,この関係が単語(語義)の分散表現から推定できることを示した.ただし,ここで用いたのは語そのものの分散表現ではなく,単語共起のパタンの分散表現である.このような分散表現を作成する際に問題となるデータの過疎性の問題を回避する手法を提案し,それを利用して獲得した単語共起のパタンの分散表現が意味関係の同定のために有益であることを示した.また,語義記述の分散表現からある語義をネットワーク表現の適切な位置に配置する手法を提案した.
|