• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

経験マイニング : Web文書からの個人の経験の抽出と分類

Research Project

Project/Area Number 19024057
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Science and Engineering
Research InstitutionNara Institute of Science and Technology

Principal Investigator

乾 健太郎  Nara Institute of Science and Technology, 情報科学研究科, 准教授 (60272689)

Project Period (FY) 2007 – 2008
Project Status Completed (Fiscal Year 2008)
Budget Amount *help
¥6,400,000 (Direct Cost: ¥6,400,000)
Fiscal Year 2008: ¥3,200,000 (Direct Cost: ¥3,200,000)
Fiscal Year 2007: ¥3,200,000 (Direct Cost: ¥3,200,000)
Keywordsテキストマイニング / プログ / 経験 / 自然言語処理 / 意味解析 / 情報抽出 / 事実性解析 / 評価極性 / ブログ
Research Abstract

商品やサービスなど, 指定されたトピックに関連する個人の経験の記述をWeb文書集合から収集し, 述語項構造に基づく表現形式に構造化するとともに, 事態タイプ(ポジティブ/ネガティブな出来事・状態, 入手・利用等の行為など)や事実性情報(当該事態の時間情報とそれに対する話者態度)といった意味情報を解析する経験マイニングを開発した. 20年度の具体的成果は次の4点である.
(1)評価極性知識獲得の大規模実験 : 事態タイプのうち, とくに「遅刻する, 炎症が治まる, 錆が出る」など, 評価極性を持つ出来事に関する知識の獲得に注力し, 大規模なWeb文書コーパスからこれを獲得する実験を行った. その結果, コーパスのサイズを大きくすると, 獲得できる知識の精度, カバレッジともに劇的に向上に, 最終的に1.6億文のコーパスから75以上のカバレッジを85以上の精度で獲得できることが確かめられた.
(2)事実性解析モデルの洗練 : 事実性解析については, 2007年度の成果をベースに, 事実性タグ体系の見直しと訓練データの拡張を行った. また, 文中で隣接する事態表現の事実性の間に依存関係があることに着目し, これをFactorial CRFでモデル化することによって解析精度を向上させることができた.
(3)公開デモサイト「みんなの経験」の開発 : 以上の成果を利用し, 文書集合から実際に経験情報を抽出し, データペース化するシステムを開発するとともに, これを最近1年半分のプログ記事(約1億5千万記事)に適用し, 約5千万件の経験情報からなる経験データベースを構築した. このデータベースは, 今年度新たに開発した公開デモサイト「みんなの経験」で検索できるようになっている. 同サイトは, プログデータの利用契約の締結に時間を要したが, 2008年12月上旬に無制限一般公開できる運びになっている.
(4)民間への技術移転 : 大手Webポータルサイト「@nifty」を運営するニフティ株式会社と連携し, 同社のサービス業務に経験マイニングの技術を導入する準備を進めた.

Report

(2 results)
  • 2008 Annual Research Report
  • 2007 Annual Research Report
  • Research Products

    (17 results)

All 2009 2008 2007 Other

All Journal Article (6 results) (of which Peer Reviewed: 3 results) Presentation (9 results) Remarks (2 results)

  • [Journal Article] Experience mining : Building a large-scale database of personal experiences and opinions from Web documents2008

    • Author(s)
      Kentaro Inui
    • Journal Title

      Proceedings of the 2008 IEEE/WIC/ACM International Conference on Web Intelligence

      Pages: 890-896

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Two-phased event relation acquisition : coupling the relation-oriented andargument-oriented approaches2008

    • Author(s)
      Shuya Abe
    • Journal Title

      Proceedings of the 22nd International Conference on Computational Linguistics (COLING-2008)

      Pages: 1-8

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] キーワードサーチを超える情報爆発サーチ-自然言語処理で価値ある未知をマイニング-2008

    • Author(s)
      鳥澤健太郎
    • Journal Title

      情報処理 49(8)

      Pages: 890-896

    • Related Report
      2008 Annual Research Report
  • [Journal Article] 言語情報間の含意・矛盾関係の認識2008

    • Author(s)
      乾健太郎
    • Journal Title

      月刊言語 2008年8月号

      Pages: 30-37

    • Related Report
      2008 Annual Research Report
  • [Journal Article] WWWからの知識獲得2008

    • Author(s)
      乾健太郎, 鳥澤健太郎
    • Journal Title

      日本語学 27(2)

      Pages: 48-61

    • Related Report
      2007 Annual Research Report
  • [Journal Article] Extracting Aspect-Evaluation and Aspect-Of Relations in Opinion Mining2007

    • Author(s)
      Nozomi Kobayasbi, Kentaro Inui, Yuji Matsumoto
    • Journal Title

      Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP-CoNLL)

      Pages: 1065-1074

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Presentation] 日本語文のモダリティ・極性情報を捉えるために2009

    • Author(s)
      佐尾ちとせ, 江口萌, 松吉俊, 乾健太郎
    • Organizer
      言語処理学会第15回年次大会発表論文集
    • Place of Presentation
      鳥取
    • Year and Date
      2009-03-03
    • Related Report
      2008 Annual Research Report
  • [Presentation] みんなの経験 : プログから抽出したイベントおよびセンチメントのDB化2009

    • Author(s)
      阿部修也, 江口萌, 隅田飛鳥, 大崎梓, 乾健太郎
    • Organizer
      言語処理学会第15回年次大会発表論文集
    • Place of Presentation
      烏取
    • Year and Date
      2009-03-03
    • Related Report
      2008 Annual Research Report
  • [Presentation] Common semantic resources for textual statement extraction and organization2008

    • Author(s)
      Kentaro Inui
    • Organizer
      NSF Sponsored Symposium on Semantic Knowledge Discovery, Organization and Use, Invited talk
    • Place of Presentation
      ニューヨーク
    • Year and Date
      2008-11-15
    • Related Report
      2008 Annual Research Report
  • [Presentation] 言語処理から知に迫る-自然言語処理からの再挑戦-2008

    • Author(s)
      乾健太郎
    • Organizer
      第23回社会的知能発生学研究会, 招待講演
    • Place of Presentation
      奈良
    • Year and Date
      2008-08-08
    • Related Report
      2008 Annual Research Report
  • [Presentation] 2種類のアンカー情報と共起パターンの組み合わせによる事態間関係獲得2008

    • Author(s)
      阿部修也, 乾健太郎, 松本裕治
    • Organizer
      情報処理学会自然言語処理研究会技術報告
    • Place of Presentation
      函館
    • Year and Date
      2008-07-17
    • Related Report
      2008 Annual Research Report
  • [Presentation] 経験マイニング:Webテキストからの個人の経験の抽出と分類2008

    • Author(s)
      乾健太郎, 原一夫
    • Organizer
      言語処理学会第14回年次大会論文集
    • Place of Presentation
      東京
    • Year and Date
      2008-03-20
    • Related Report
      2007 Annual Research Report
  • [Presentation] 述語の選択選好性に着目した名詞評価極性の獲得2008

    • Author(s)
      東山昌彦, 乾健太郎, 松本裕治
    • Organizer
      言語処理学会第14回年次大会論文集
    • Place of Presentation
      東京
    • Year and Date
      2008-03-20
    • Related Report
      2007 Annual Research Report
  • [Presentation] 経験マイニングのための事実性解析2008

    • Author(s)
      原一夫, 東山昌彦, 乾健太郎, 松本裕治
    • Organizer
      情報処理学会第70回全国大会
    • Place of Presentation
      筑波
    • Year and Date
      2008-03-14
    • Related Report
      2007 Annual Research Report
  • [Presentation] 事態抽出のための事実性解析2008

    • Author(s)
      原一夫, 乾健太郎
    • Organizer
      情報処理学会研究報告自然言語処理研究会
    • Place of Presentation
      東京
    • Year and Date
      2008-01-22
    • Related Report
      2007 Annual Research Report
  • [Remarks]

    • URL

      http://cl.naist.ip/~inui/research/EM/

    • Related Report
      2008 Annual Research Report
  • [Remarks]

    • URL

      http://cl.naist.jp/~inui/research/EM/

    • Related Report
      2007 Annual Research Report

URL: 

Published: 2007-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi