2012 Fiscal Year Research-status Report
語彙から受ける印象の知識構築法と曖昧な表現における意図理解への応用
Project/Area Number |
24700209
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | The University of Tokushima |
Principal Investigator |
森田 和宏 徳島大学, ソシオテクノサイエンス研究部, 講師 (20325252)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 印象知識 |
Research Abstract |
人間の発する曖昧な表現における意図理解を実現するため,平成24年度は,語彙から受ける印象を知識ベースとして構築するための準備段階として,次に示す辞書構造の考案と,印象情報の収集・調査を実施した. 1.語彙と複数の印象情報,またその関係を紐付ける新しい辞書構造の考案と開発 まず,一般的な索引語の格納形式であるトライ構造と,その効率的なデータ構造であるダブル配列の研究成果を活用し,語彙と印象を全て索引語として辞書に保存する手法を考案した.次に,索引語同士を紐付けるために,共起情報を効率よく格納する辞書構造の研究成果を発展させ,複数の索引語に関係する情報を,付属情報として保存できる構造を考案した.この手法は,紐付けられた索引語群の相互検索を可能にするとともに,辞書サイズを抑える工夫を施すことで,登録される情報の増加に対処された構造となっている.また,この辞書構造を実現する登録・検索エンジンのプロトタイプを開発した. 2.人手による,語彙から受ける印象情報の収集と,Webからの自動獲得に向けた傾向の調査 上記1の辞書構造の考案と平行して,人手による印象情報の収集をおこなった.収集には研究協力者3名が参加し,各作業者が選択した名詞から受ける印象や,連想する表現を可能な限り書き出すことによりおこなった.約3万表現が収集された.次に,収集した表現に対してWeb検索を行い,語彙と収集表現間の関連性を,Jaccard係数などの共起度や,スニペットの目視などで調査をおこなった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の研究実施計画通りに研究を遂行できたため,おおむね順調であると考える.
|
Strategy for Future Research Activity |
今後も研究実施計画に沿って研究を進める.次年度は,今年度おこなった収集表現の調査結果を利用して,Webテキストから印象情報を獲得する手法の考案と,印象知識構築エンジンを実装して,Webからの知識構築を試みる計画である.エンジンの実装に時間を要する可能性があるため,遅延が発生した場合には研究協力者に参加してもらうことで対処する.
|
Expenditure Plans for the Next FY Research Funding |
本年度の研究に必要な物品が予定より少額で賄えたため当該研究費が生じたが,次年度はバックアップ用品が多く必要になると予想されるため,当該研究費は次年度の研究費と合わせ,バックアップ用品に使用する計画である.
|