• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

日英二言語のブログ文書を対象とした意見抽出と要約生成に関する研究

研究課題

研究課題/領域番号 21700268
研究機関筑波大学

研究代表者

関 洋平  筑波大学, 大学院・図書館情報メディア研究科, 助教 (00348468)

キーワードブログ / アプレイザル理論 / 多言語辞書 / 多言語意見分析タスク / 意見情報
研究概要

本研究では,アプレイザル理論に基づく英語の辞書から,日本語のアプレイザル辞書を構築し,日英の意見抽出における効果について検証を行った。アプレイザル理論に基づく辞書は,言語学の詳細な分析に基づいて構成されるため,語彙項目のカバー率は限定されたものになる。本研究では,WordNet,JWordNetに基づき同義語を展開することで辞書のカバー率を向上させると同時に,SentiWordNetのスコアに基づきフィルタリングを行うことで,辞書の精度を向上させることを試みた。NTCIR-8多言語意見分析タスクのテストコレクションを用いた実験から,この辞書は意見分析を行う上で,高い再現率を実現できる十分なカバレッジを得ていることを確認した。また,人手で判定をやり直し,辞書の精度の向上を試みた。
また,NTCIR-8の多言語意見分析タスクでは,日本語,英語,中国語を対象とした意見分析のための評価タスクを新たに開催した。過去2回の開催では,システムの評価の正解として使う判定者間の意見の判定一致率が低いという課題があった。今回の開催では,言語間のデータフォーマットの統一をアノテーションツール,評価ツールを用いることで達成し,日本語,英語,中国語(簡体字・繁体字)の4言語で共通のXMLフォーマットによる意見分析コーパスを作成し,言語横断意見検索タスクの実現を容易にした。結果として,過去2回の開催よりも,(特に)英語,中国語の判定者間の一致率(κ係数)が向上した。
さらに,Yahoo!ブログを対象として,意見情報と意見対象タイプを付与したアノテーションについて分析を行った結果,頻出する態度評価と意見対象タイプの組み合わせについて,コンピュータ,エンターテイメント,政治などドメインに特徴的な意見を把握することができることを確認した。また,国会の本会議において,国会の本会議においては,"抽象概念","行為概念","製品名"などが,意見の対象とされていることを確認した。

  • 研究成果

    (10件)

すべて 2011 2010

すべて 学会発表 (10件)

  • [学会発表] 研究活動・成果の総括:意見情報班 多様な文書ジャンルを対象とした意見分析コーパスの作成に関する研究2011

    • 著者名/発表者名
      関洋平, 神門典子, 佐野大樹, 柏野和佳子, 稲垣陽一, 栗山和子
    • 学会等名
      科学研究費補助金 特定領域研究「日本語コーパス」平成22年度公開WS予稿集
    • 発表場所
      時事通信会館(震災で中止)
    • 年月日
      2011-03-15
  • [学会発表] QAコミュニティにおける質問者の期待に基づく質問分類に関する一検討2011

    • 著者名/発表者名
      渡邊直人, 島田諭, 関洋平, 神門典子, 佐藤哲司
    • 学会等名
      第3回データ工学と情報マネジメントに関するフォーラム(DEIM 2011)
    • 発表場所
      修善寺
    • 年月日
      2011-02-28
  • [学会発表] 情報要求の言語化を支援するクエリ拡張型Web検索システム2011

    • 著者名/発表者名
      大塚淳史, 関洋平, 神門典子, 佐藤哲司
    • 学会等名
      第3回データ工学と情報マネジメントに関するフォーラム(DEIM 2011)
    • 発表場所
      修善寺
    • 年月日
      2011-02-28
  • [学会発表] 投稿間隔に基づくマイクロブログからの話題チャンク抽出に関する一検討2011

    • 著者名/発表者名
      新谷歩生, 関洋平, 佐藤哲司
    • 学会等名
      第3回データ工学と情報マネジメントに関するフォーラム(DEIM 2011)
    • 発表場所
      修善寺
    • 年月日
      2011-02-27
  • [学会発表] 属性伝搬モデルを用いたマイクロブログのフォロー先推薦法2011

    • 著者名/発表者名
      康大樹, 島田諭, 関洋平, 佐藤哲司
    • 学会等名
      第3回データ工学と情報マネジメントに関するフォーラム(DEIM 2011)
    • 発表場所
      修善寺
    • 年月日
      2011-02-27
  • [学会発表] Using Graded-Relevance Metrics for Evaluating Community QA Answer Selection2011

    • 著者名/発表者名
      Tetsuya Sakai, Daisuke Ishikawa, Noriko Kando, Yohei Seki, Kazuko Kuriyama, Chin-Yew Lin
    • 学会等名
      Proceedings of The Fourth ACM Conference on Web Search and Data Mining (WSDM 2011)(査読付)
    • 発表場所
      Kowloon, Hong Kong
    • 年月日
      2011-02-11
  • [学会発表] 言語を横断したアプレイザル辞書の構築と多言語意見分析タスクにおける評価2010

    • 著者名/発表者名
      関洋平
    • 学会等名
      情報アクセスシンポジウム2010(査読付)
    • 発表場所
      東京大学
    • 年月日
      2010-09-27
  • [学会発表] 平成22年度研究進捗状況報告:意見情報班 多様な文書ジャンルを対象とした意見分析コーパスの作成に関する研究2010

    • 著者名/発表者名
      関洋平, 神門典子, 佐野大樹, 柏野和佳子, 稲垣陽一, 栗山和子
    • 学会等名
      科学研究費補助金 特定領域研究 日本語コーパス領域平成22年度全体会議
    • 発表場所
      国立国語研究所
    • 年月日
      2010-08-30
  • [学会発表] Overview of Multilingual Opinion Analysis Task at NTCIR-8-A Step Toward Cross-Lingual Opinion Analysis2010

    • 著者名/発表者名
      Yohei Seki, Lun-Wei Ku, Le Sun, Hsin-Hsi Chen, Noriko Kando
    • 学会等名
      Proc.of the Eighth NTCIR Workshop
    • 発表場所
      NII, Japan
    • 年月日
      2010-06-18
  • [学会発表] Q&Aサイトにおけるベストアンサー推定の分析とその機械学習への応用2010

    • 著者名/発表者名
      石川大介, 栗山和子, 酒井哲也, 関洋平, 神門典子
    • 学会等名
      情報知識学会 第18回(2010年度)年次大会
    • 発表場所
      東京大学
    • 年月日
      2010-05-15

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi