研究概要 |
本年度は,利用者自身の体験や自然な本音を反映したコンテンツとして,コミュニティ型質問応答サイト(CQA)に焦点を当てた研究を遂行した。本年度は,意見抽出や要約の基盤技術と応用事例として,良質回答の自動予測と,クエリ拡張型Web検索システムについて研究を遂行した。CQAに投稿された回答の質は様々であるため,その中から良質な回答を選択する方法が求められている。そこで,Yahoo!知恵袋データにおける良質回答を人手で分析し,その結果に基づいて良質回答自動予測システムを構築した。具体的には,「恋愛相談」「パソコン」「一般教養」「政治」の4つのカテゴリからそれぞれ無作為に50問の質問を抽出し,良質回答の特徴として「詳しさ」「根拠」「丁寧さ」に基づく機械学習システムを構築し,CQAアーカイブから自動的に良質回答を発見するシステムの可能性を示した。また,Web検索で必要な言語化された検索システムクエリの想起を,質問記事を提示することで支援するクエリ拡張型Web検索システムを提案した。本システムにより,検索者は,提示された質問記事を閲覧することで,自身の情報要求を,拡張の根拠となる言語化された検索クエリとして確認することができる。その他,国立国語研究所の製作する現代日本語書き言葉均衡コーパス(BCCWJ)の中からYahoo!知恵袋と書籍とYahooブログと国会会議録を対象として,意見分析コーパスを作成した。これにより,さまざまな文書ジャンルやドメインを対象として意見情報の分析を進め,傾向の違いを整理し,情報ブクセスに着目した応用を進める上で,必要となる意見情報がドメインに依存することを明らかにした。さらに,作成したコーパスを用いて,複数ドメインを対象としたアンサンブル学習による意見分析システムを提案した。また,Twitterコンテンツ中のテキストに現れる感情の推定に基づく顔文字推薦,人と実体間の関係推定,対訳表現を手がかりとした用例選択に基づく機械翻訳など,意見を介したコミュニケーション支援についての基礎研究を進めた。
|