2012 Fiscal Year Annual Research Report
インターネットから幸福な生活情報を検索するための感情表現パターン知識ベースの構築
Project/Area Number |
22700100
|
Research Institution | Tottori University |
Principal Investigator |
徳久 雅人 鳥取大学, 工学(系)研究科(研究院), 講師 (10274557)
|
Project Period (FY) |
2010-04-01 – 2014-03-31
|
Keywords | インターネット高度化 / 情報検索 / 言語知識ベース / 生活改善 / 感情 / 分析支援 / 観光情報 |
Research Abstract |
本研究はインターネットから幸福なライフスタイルに関する情報を選択的に閲覧する手法の基盤となる知識ベースの構築を目的とする。具体的には、人々の活動の様子について記述されたブログの文章を自動解析し、とりわけ、楽しい事柄を検索する技術の開発を行う。本技術により、人々が幸福な生活情報を得ることが容易になり、人々の満足度や意欲・理想の向上に繋がることを期待する。また、知識ベースという形式をとることで自然言語の意味処理のハードルを下げることを目指す。 平成24年度は、感情を推定するための知識ベース、および、事態を解析するための知識ベースの構築を目標とした。 感情推定のための知識ベースは、日本語語彙大系(岩波書店)を基礎とし、感情の生じる原因を解析するための情報を付随させた。本年度の整備により、状況の対称性を考慮した感情推定が可能になった。たとえば、「つまらない物を貰う」という入力文において、従来は、「喜び」という出力だったものを、「悲しみ、または、感情なし」という出力に調整が可能になった。9分類の感情名を推定する性能は、42%だったものが53%に(快/不快/なしの3分類では90%に)向上した。 事態解析のための知識ベースは、物の存在性に焦点を当てた。2つの述語を基準に、場所と存在物を文書から抽出する。たとえば、「鳥取に行った。梨ソフトを食べた。」という2文からは「鳥取」に「梨ソフト」が存在することを解析するが、「梨ソフトを食べた。香住に行った。」という2文からは「香住」に存在するとはしてはならない。そこで本知識ベースは、1文目と2文目をそれぞれ機械的にパターン化し、約15万件収録した。解析性能はF値で0.3なので次年度改善する。 一方、知識ベースの運用と情報検索を、観光における行動分析に応用した。幸福な行動を表示することで、旅行者の楽しみを高めるための観光振興案の発想支援ができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は、幸福な生活情報をインターネットから検索するために、感情推定の知識ベースを開発することを主目的とし、その具体的な価値を示すために、検索に関する手法の提案を副目的としている。 感情推定のために、感情の生じる原因を直接的に表現する文を判定する知識ベースを構築し、その改善を進めることができた。日本語語彙大系(岩波書店)の用言パターン(1.4万件)をベースにした。判定知識はそこへの追加情報として構築した。本年度は、状況解析の性能を高めた。その結果、感情推定の性能が42%から53%へと向上した。また、感情の生じる原因を間接的に表現する文章を判定することに向けて、物の存在性を判定する知識ベースの構築を進めている。たとえば、一般に好まれる物体の存在が、インターネットのブログや掲示板から確認されると、その書き手にポジティブな感情が生起していると推定される。連続する2文から、存在物とその場所の記述を抽出するという設定で実験を進めている。現在は機械的に知識ベースを構築した段階である。次年度は、問題を精査し改善する。 一方、検索に関して、幸福な情報を、分かり易く、かつ、効率的に出力する方法を開発した。課題を明確にするために、観光地における旅行者の行動分析と設定した。旅行に関する行動であること、かつ、幸福であることで検索し、類似する行動はまとめられ冗長性が抑制されていることとして出力する方法である。事例研究として「ブルーベリー狩り」についての1年ぶんのブログ記事(1.5万文)を分析する課題において、本研究の検索により閲覧を効率化することで、削除率92%で閲覧文数を抑制し、約3時間で行動分析を完了した。別の事例研究として観光地の開発案の発想支援を行うために、能動学習を用いた。その素性には感情など、本知識ベースの解析結果を用いた。 以上のとおり、主・副両目的についておおむね達成している。
|
Strategy for Future Research Activity |
本研究の最終年度なので、成果として2つの言語知識ベースの公開を目指す。1つは、感情原因を直接的に表す知識ベース、もう1つは存在性を解析するための知識ベースである。これは感情の生じる原因を間接的に解釈するための基礎となり、これらを通じて感情推定の性能が高まることと期待される。ここで、パターン形式の知識ベースは、運用方法の説明無しには性能が発揮できない。そこで、本年度は運用方法を指南する準備を行う。 前者については、理想的な運用ができる場合には処理性能がある程度確保できているので、本年度はその運用方法を一般化することである。たとえば、「N1がN2を貰う」というパターンは、「N1にとってN2が有益なもの」ならば「N1に喜びが生じる」という感情推定を導く。入力文から前提の充足を判定することを理想状態に近づければ、本知識ベースの解析性能が発揮できる。N1とN2の関係をコーパスから学習する方法、および、N2の一般的な評価極性をコーパスから学習する方法を既に提案した。本年度は、昨年度に改善した知識ベースを用いつつ、提案手法をより形式的な方法に一般化し、運用方法のマニュアル化を行う。 後者については、昨年度に機械的に15万パターンを生成し、実現可能性を検討した。たとえば、「/N1に/行く。/N2を/食べる。」というパターンを文章に照合することにより、「N2に適合した名詞=存在物、N1に適合した名詞=存在場所」という存在情報を得る。パターン化の方法を丁寧なものに変更したり、照合の条件を調整することにより、解析性能を高めることを試みる。ある程度の性能が得られれば、パターンの選別を行い、実験から得た知見より運用方法のマニュアル化を行う。
|
Research Products
(7 results)