• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

経験マイニング : Web文書からの個人の経験の抽出と分類

Research Project

Project/Area Number 19024057
Research InstitutionNara Institute of Science and Technology

Principal Investigator

乾 健太郎  Nara Institute of Science and Technology, 情報科学研究科, 准教授 (60272689)

Keywordsテキストマイニング / プログ / 経験 / 自然言語処理 / 意味解析 / 情報抽出 / 事実性解析 / 評価極性
Research Abstract

商品やサービスなど, 指定されたトピックに関連する個人の経験の記述をWeb文書集合から収集し, 述語項構造に基づく表現形式に構造化するとともに, 事態タイプ(ポジティブ/ネガティブな出来事・状態, 入手・利用等の行為など)や事実性情報(当該事態の時間情報とそれに対する話者態度)といった意味情報を解析する経験マイニングを開発した. 20年度の具体的成果は次の4点である.
(1)評価極性知識獲得の大規模実験 : 事態タイプのうち, とくに「遅刻する, 炎症が治まる, 錆が出る」など, 評価極性を持つ出来事に関する知識の獲得に注力し, 大規模なWeb文書コーパスからこれを獲得する実験を行った. その結果, コーパスのサイズを大きくすると, 獲得できる知識の精度, カバレッジともに劇的に向上に, 最終的に1.6億文のコーパスから75以上のカバレッジを85以上の精度で獲得できることが確かめられた.
(2)事実性解析モデルの洗練 : 事実性解析については, 2007年度の成果をベースに, 事実性タグ体系の見直しと訓練データの拡張を行った. また, 文中で隣接する事態表現の事実性の間に依存関係があることに着目し, これをFactorial CRFでモデル化することによって解析精度を向上させることができた.
(3)公開デモサイト「みんなの経験」の開発 : 以上の成果を利用し, 文書集合から実際に経験情報を抽出し, データペース化するシステムを開発するとともに, これを最近1年半分のプログ記事(約1億5千万記事)に適用し, 約5千万件の経験情報からなる経験データベースを構築した. このデータベースは, 今年度新たに開発した公開デモサイト「みんなの経験」で検索できるようになっている. 同サイトは, プログデータの利用契約の締結に時間を要したが, 2008年12月上旬に無制限一般公開できる運びになっている.
(4)民間への技術移転 : 大手Webポータルサイト「@nifty」を運営するニフティ株式会社と連携し, 同社のサービス業務に経験マイニングの技術を導入する準備を進めた.

  • Research Products

    (10 results)

All 2009 2008 Other

All Journal Article (4 results) (of which Peer Reviewed: 2 results) Presentation (5 results) Remarks (1 results)

  • [Journal Article] Experience mining : Building a large-scale database of personal experiences and opinions from Web documents2008

    • Author(s)
      Kentaro Inui
    • Journal Title

      Proceedings of the 2008 IEEE/WIC/ACM International Conference on Web Intelligence

      Pages: 890-896

    • Peer Reviewed
  • [Journal Article] Two-phased event relation acquisition : coupling the relation-oriented andargument-oriented approaches2008

    • Author(s)
      Shuya Abe
    • Journal Title

      Proceedings of the 22nd International Conference on Computational Linguistics (COLING-2008)

      Pages: 1-8

    • Peer Reviewed
  • [Journal Article] キーワードサーチを超える情報爆発サーチ-自然言語処理で価値ある未知をマイニング-2008

    • Author(s)
      鳥澤健太郎
    • Journal Title

      情報処理 49(8)

      Pages: 890-896

  • [Journal Article] 言語情報間の含意・矛盾関係の認識2008

    • Author(s)
      乾健太郎
    • Journal Title

      月刊言語 2008年8月号

      Pages: 30-37

  • [Presentation] 日本語文のモダリティ・極性情報を捉えるために2009

    • Author(s)
      佐尾ちとせ, 江口萌, 松吉俊, 乾健太郎
    • Organizer
      言語処理学会第15回年次大会発表論文集
    • Place of Presentation
      鳥取
    • Year and Date
      2009-03-03
  • [Presentation] みんなの経験 : プログから抽出したイベントおよびセンチメントのDB化2009

    • Author(s)
      阿部修也, 江口萌, 隅田飛鳥, 大崎梓, 乾健太郎
    • Organizer
      言語処理学会第15回年次大会発表論文集
    • Place of Presentation
      烏取
    • Year and Date
      2009-03-03
  • [Presentation] Common semantic resources for textual statement extraction and organization2008

    • Author(s)
      Kentaro Inui
    • Organizer
      NSF Sponsored Symposium on Semantic Knowledge Discovery, Organization and Use, Invited talk
    • Place of Presentation
      ニューヨーク
    • Year and Date
      2008-11-15
  • [Presentation] 言語処理から知に迫る-自然言語処理からの再挑戦-2008

    • Author(s)
      乾健太郎
    • Organizer
      第23回社会的知能発生学研究会, 招待講演
    • Place of Presentation
      奈良
    • Year and Date
      2008-08-08
  • [Presentation] 2種類のアンカー情報と共起パターンの組み合わせによる事態間関係獲得2008

    • Author(s)
      阿部修也, 乾健太郎, 松本裕治
    • Organizer
      情報処理学会自然言語処理研究会技術報告
    • Place of Presentation
      函館
    • Year and Date
      2008-07-17
  • [Remarks]

    • URL

      http://cl.naist.ip/~inui/research/EM/

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi