研究課題/領域番号 |
23500302
|
研究機関 | 白百合女子大学 |
研究代表者 |
栗山 和子 白百合女子大学, 文学部, 准教授 (10349144)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | コミュニティサイト / CQA / パスファインダー / 情報アクセス技術 |
研究概要 |
コミュニティ質問応答サイト(CQA)において、投稿された回答の質は様々であるため、その中から良質な回答を選択する方法が求められている。そこで本研究では、Yahoo!知恵袋データにおける良質回答を人手で分析し、その結果に基づいて良質回答自動予測システムを構築した。無作為に質問を抽出し、人間の判定者によって手作業で良質回答を決定し、その結果を分析して、良質回答の特徴として「詳しさ」「根拠」「丁寧さ」に基づく機械学習システムを構築した。機械学習システムの評価結果は、判定者らとほぼ同程度であった。以上の結果から、CQAアーカイブから自動的に良質回答を発見するシステムの可能性が示された。質問タイプと機械学習による自動分類については、既に提案しているが、これにより、質問タイプに合った良質回答を機械学習によって行える可能性がある。さらに、利用者行動とコミュニケーションタイプを分析することによって、利用者の利用目的とコミュニケーションタイプに合った既存の投稿データを自動的に探して推薦するシステムの構築の可能性も考えられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
「OK WAVE(教えて!Goo)」などの「Yahoo!知恵袋」とは異なるCQAサイト、および、「Twitter」や「Facebook」などの異なるコミュニケーションタイプのコミュニティサイトのデータを用いて、利用者の利用行動、コミュニケーションタイプ、文書構造などを分析する予定であったが、東日本大震災の影響により、Twitterなどのマイクロブログサイトの利用者層や利用目的が一時的に大きく変化したため、データの収集を一定期間(半年ほど)控えなければならかなった。それにより、データの分析期間が十分でなくなり、コミュニケーションタイプの詳しい分析と提案にまで至らなかった。
|
今後の研究の推進方策 |
引き続き、類似したコミュニティサイト、および、異なるのコミュニティサイトの使い分け、コミュニケーションタイプ、本来のサイトの目的とは異なる利用法などを、特定の利用者グループ(コミュニティ)の利用行動や特定の投稿カテゴリの投稿データを分析することを通じて考察する。また、文書データを構成要素に分割する方法を検討し、複数の被験者による構成要素タグの付与を行い、文書構造のパターンを明らかにしたい。さらに、コミュニティサイトの特性に合った代表的なコミュニケーションタイプの分類を提案したい。
|
次年度の研究費の使用計画 |
当初の予定通り、主に、異なる複数の判定者による投稿データのタイプ分類・文書構造のタグ付けなどの実験データ作成の人件費、国内外の研究会・学会の参加費・出張費に使用する。
|