研究課題/領域番号 |
20500106
|
研究機関 | 龍谷大学 |
研究代表者 |
渡辺 靖彦 龍谷大学, 理工学部, 講師 (10288665)
|
研究分担者 |
岡田 至弘 龍谷大学, 理工学部, 教授 (30127063)
馬 青 龍谷大学, 理工学部, 教授 (30358882)
吉見 毅彦 龍谷大学, 理工学部, 准教授 (50368031)
南條 浩輝 龍谷大学, 理工学部, 助教 (50388162)
|
キーワード | webサービス |
研究概要 |
21年度は、言語資源をさらに収集しつつ、関連研究のサーベイを進めながら、質問作成支援システムを試作するために、コミュニケーションサイトへ投稿する質問を作成するのに役立つ情報を抽出する方法について検討を行った。質問を作成するのに役立つ情報として、(1)特定の質問でだけ説明される特殊な情報、(2)さまざまな質問で説明されるのがのぞましい情報、の2種類を取り上げ、それらの情報をコミュニケーションサイトに投稿されたメッセージ(質問と回答)から取り出す方法について検討を行なった。調査・実験にはYahoo!知恵袋を利用した。さらに、メッセージからの情報抽出の精度を低下させる問題として、メッセージの評価の操作について20年度に引続き検討を行った。メッセージの評価の操作は、複数のユーザIDを利用して別人になりすましたユーザによって行われることが多い。評価の高いメッセージから情報を取り出すのがのぞましいので、複数のユーザIDを利用してメッセージを投稿しメッセージの評価の操作を行なっている可能性のあるユーザを投稿履歴と文体の特徴を利用して特定する方法についてYahoo!知恵袋の「政治・社会問題」のカテゴリを対象にして検討を行い、非常に疑わしいユーザを検出することができることを明らかにした。また、メッセージへの評価を低下させる原因の1つである、投稿されたメッセージにおける表記の選択の混乱(具体的には劣勢な表記の利用)についても20年度に引続き検討を行った。具体的には、新聞記事および専門文書における表記のゆれを文脈も考慮して再調査し、その結果にもとづいて20年度に作成した優勢表記辞書を拡張し、優勢な表記の利用を促す作文支援システムを改良した。
|