Research Abstract |
18年度は,共起情報からの意味的類似性に着目し,係り語に対する概念知識を獲得するため,共起情報を効率よく格納するための辞書構造の考案と,共起情報から係り語を意味的に分類するアルゴリズムの提案を次の順序で行った. 1.共起情報とともに単語の概念情報を格納できる辞書構造の提案と開発 過去の研究成果をもとに,トライ構造を用いて共起情報とともに単語の概念情報を効率よく格納できる新しい辞書構造を考案した.この手法は,数十万語彙から無限に生成される共起情報を,数十MB程度の辞書に格納できるようになることや,係り語の持つ受け語群や,同一概念を持つ単語が相互検索できるようになること,探索時間計算量も0(k)(k:語彙長)となることなどの特徴がある.また,この辞書構造を用いた,辞書エンジンのプロトタイプ開発を行った. 2.共起情報を格納し,係り語を意味的に分類するアルゴリズムの提案と評価 先に考案した辞書格納手法を用いて,共起情報から係り語を意味的に分類するアルゴリズムの提案を行った.具体的には,係り語の持つ受け語群の頻度などから,特徴ベクトルを生成し,他の係り語との類似度を判定することによって分類を行う.また,この分類処理は一単語単位で行うことができるため,頻繁な更新にも十分に対応でき,分類結果も同一の辞書構造内に格納できる.このアルゴリズムの評価のため,実験として開発した辞書エンジンのプロトタイプに共起情報を格納し,分類精度などの評価を行った.
|