研究概要 |
人間の発する曖昧な表現における意図理解を実現するため,平成24年度は,語彙から受ける印象を知識ベースとして構築するための準備段階として,次に示す辞書構造の考案と,印象情報の収集・調査を実施した. 1.語彙と複数の印象情報,またその関係を紐付ける新しい辞書構造の考案と開発 まず,一般的な索引語の格納形式であるトライ構造と,その効率的なデータ構造であるダブル配列の研究成果を活用し,語彙と印象を全て索引語として辞書に保存する手法を考案した.次に,索引語同士を紐付けるために,共起情報を効率よく格納する辞書構造の研究成果を発展させ,複数の索引語に関係する情報を,付属情報として保存できる構造を考案した.この手法は,紐付けられた索引語群の相互検索を可能にするとともに,辞書サイズを抑える工夫を施すことで,登録される情報の増加に対処された構造となっている.また,この辞書構造を実現する登録・検索エンジンのプロトタイプを開発した. 2.人手による,語彙から受ける印象情報の収集と,Webからの自動獲得に向けた傾向の調査 上記1の辞書構造の考案と平行して,人手による印象情報の収集をおこなった.収集には研究協力者3名が参加し,各作業者が選択した名詞から受ける印象や,連想する表現を可能な限り書き出すことによりおこなった.約3万表現が収集された.次に,収集した表現に対してWeb検索を行い,語彙と収集表現間の関連性を,Jaccard係数などの共起度や,スニペットの目視などで調査をおこなった.
|