経験マイニング : Web文書からの個人の経験の抽出と分類

研究課題

研究課題/領域番号	19024057
研究種目	特定領域研究
配分区分	補助金
審査区分	理工系
研究機関	奈良先端科学技術大学院大学
研究代表者	乾健太郎奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (60272689)
研究期間 (年度)	2007 – 2008
研究課題ステータス	完了 (2008年度)
配分額 *注記	6,400千円 (直接経費: 6,400千円) 2008年度: 3,200千円 (直接経費: 3,200千円) 2007年度: 3,200千円 (直接経費: 3,200千円)
キーワード	テキストマイニング / プログ / 経験 / 自然言語処理 / 意味解析 / 情報抽出 / 事実性解析 / 評価極性 / ブログ
研究概要	商品やサービスなど, 指定されたトピックに関連する個人の経験の記述をWeb文書集合から収集し, 述語項構造に基づく表現形式に構造化するとともに, 事態タイプ(ポジティブ/ネガティブな出来事・状態, 入手・利用等の行為など)や事実性情報(当該事態の時間情報とそれに対する話者態度)といった意味情報を解析する経験マイニングを開発した. 20年度の具体的成果は次の4点である. (1)評価極性知識獲得の大規模実験 : 事態タイプのうち, とくに「遅刻する, 炎症が治まる, 錆が出る」など, 評価極性を持つ出来事に関する知識の獲得に注力し, 大規模なWeb文書コーパスからこれを獲得する実験を行った. その結果, コーパスのサイズを大きくすると, 獲得できる知識の精度, カバレッジともに劇的に向上に, 最終的に1.6億文のコーパスから75以上のカバレッジを85以上の精度で獲得できることが確かめられた. (2)事実性解析モデルの洗練 : 事実性解析については, 2007年度の成果をベースに, 事実性タグ体系の見直しと訓練データの拡張を行った. また, 文中で隣接する事態表現の事実性の間に依存関係があることに着目し, これをFactorial CRFでモデル化することによって解析精度を向上させることができた. (3)公開デモサイト「みんなの経験」の開発 : 以上の成果を利用し, 文書集合から実際に経験情報を抽出し, データペース化するシステムを開発するとともに, これを最近1年半分のプログ記事(約1億5千万記事)に適用し, 約5千万件の経験情報からなる経験データベースを構築した. このデータベースは, 今年度新たに開発した公開デモサイト「みんなの経験」で検索できるようになっている. 同サイトは, プログデータの利用契約の締結に時間を要したが, 2008年12月上旬に無制限一般公開できる運びになっている. (4)民間への技術移転 : 大手Webポータルサイト「@nifty」を運営するニフティ株式会社と連携し, 同社のサービス業務に経験マイニングの技術を導入する準備を進めた.

報告書

(2件)

2008 実績報告書
2007 実績報告書

研究成果
(17件)

すべて 2009 2008 2007 その他

すべて雑誌論文 (6件) (うち査読あり 3件) 学会発表 (9件) 備考 (2件)

[雑誌論文] Experience mining : Building a large-scale database of personal experiences and opinions from Web documents2008
- 著者名/発表者名
  Kentaro Inui
- 雑誌名
  
  Proceedings of the 2008 IEEE/WIC/ACM International Conference on Web Intelligence
  
  ページ: 890-896
- 関連する報告書
  2008 実績報告書
- 査読あり
[雑誌論文] Two-phased event relation acquisition : coupling the relation-oriented andargument-oriented approaches2008
- 著者名/発表者名
  Shuya Abe
- 雑誌名
  
  Proceedings of the 22nd International Conference on Computational Linguistics (COLING-2008)
  
  ページ: 1-8
- 関連する報告書
  2008 実績報告書
- 査読あり
[雑誌論文] キーワードサーチを超える情報爆発サーチ-自然言語処理で価値ある未知をマイニング-2008
- 著者名/発表者名
  鳥澤健太郎
- 雑誌名
  
  情報処理 49(8)
  
  ページ: 890-896
- 関連する報告書
  2008 実績報告書
[雑誌論文] 言語情報間の含意・矛盾関係の認識2008
- 著者名/発表者名
  乾健太郎
- 雑誌名
  
  月刊言語 2008年8月号
  
  ページ: 30-37
- 関連する報告書
  2008 実績報告書
[雑誌論文] WWWからの知識獲得2008
- 著者名/発表者名
  乾健太郎, 鳥澤健太郎
- 雑誌名
  
  日本語学 27(2)
  
  ページ: 48-61
- 関連する報告書
  2007 実績報告書
[雑誌論文] Extracting Aspect-Evaluation and Aspect-Of Relations in Opinion Mining2007
- 著者名/発表者名
  Nozomi Kobayasbi, Kentaro Inui, Yuji Matsumoto
- 雑誌名
  
  Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP-CoNLL)
  
  ページ: 1065-1074
- 関連する報告書
  2007 実績報告書
- 査読あり
[学会発表] 日本語文のモダリティ・極性情報を捉えるために2009
- 著者名/発表者名
  佐尾ちとせ, 江口萌, 松吉俊, 乾健太郎
- 学会等名
  言語処理学会第15回年次大会発表論文集
- 発表場所
  鳥取
- 年月日
  2009-03-03
- 関連する報告書
  2008 実績報告書
[学会発表] みんなの経験 : プログから抽出したイベントおよびセンチメントのDB化2009
- 著者名/発表者名
  阿部修也, 江口萌, 隅田飛鳥, 大崎梓, 乾健太郎
- 学会等名
  言語処理学会第15回年次大会発表論文集
- 発表場所
  烏取
- 年月日
  2009-03-03
- 関連する報告書
  2008 実績報告書
[学会発表] Common semantic resources for textual statement extraction and organization2008
- 著者名/発表者名
  Kentaro Inui
- 学会等名
  NSF Sponsored Symposium on Semantic Knowledge Discovery, Organization and Use, Invited talk
- 発表場所
  ニューヨーク
- 年月日
  2008-11-15
- 関連する報告書
  2008 実績報告書
[学会発表] 言語処理から知に迫る-自然言語処理からの再挑戦-2008
- 著者名/発表者名
  乾健太郎
- 学会等名
  第23回社会的知能発生学研究会, 招待講演
- 発表場所
  奈良
- 年月日
  2008-08-08
- 関連する報告書
  2008 実績報告書
[学会発表] 2種類のアンカー情報と共起パターンの組み合わせによる事態間関係獲得2008
- 著者名/発表者名
  阿部修也, 乾健太郎, 松本裕治
- 学会等名
  情報処理学会自然言語処理研究会技術報告
- 発表場所
  函館
- 年月日
  2008-07-17
- 関連する報告書
  2008 実績報告書
[学会発表] 経験マイニング:Webテキストからの個人の経験の抽出と分類2008
- 著者名/発表者名
  乾健太郎, 原一夫
- 学会等名
  言語処理学会第14回年次大会論文集
- 発表場所
  東京
- 年月日
  2008-03-20
- 関連する報告書
  2007 実績報告書
[学会発表] 述語の選択選好性に着目した名詞評価極性の獲得2008
- 著者名/発表者名
  東山昌彦, 乾健太郎, 松本裕治
- 学会等名
  言語処理学会第14回年次大会論文集
- 発表場所
  東京
- 年月日
  2008-03-20
- 関連する報告書
  2007 実績報告書
[学会発表] 経験マイニングのための事実性解析2008
- 著者名/発表者名
  原一夫, 東山昌彦, 乾健太郎, 松本裕治
- 学会等名
  情報処理学会第70回全国大会
- 発表場所
  筑波
- 年月日
  2008-03-14
- 関連する報告書
  2007 実績報告書
[学会発表] 事態抽出のための事実性解析2008
- 著者名/発表者名
  原一夫, 乾健太郎
- 学会等名
  情報処理学会研究報告自然言語処理研究会
- 発表場所
  東京
- 年月日
  2008-01-22
- 関連する報告書
  2007 実績報告書
[備考]
- URL
  http://cl.naist.ip/~inui/research/EM/
- 関連する報告書
  2008 実績報告書
[備考]
- URL
  http://cl.naist.jp/~inui/research/EM/
- 関連する報告書
  2007 実績報告書

経験マイニング : Web文書からの個人の経験の抽出と分類

研究代表者

乾 健太郎 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (60272689)

6,400千円 (直接経費: 6,400千円)

報告書

研究成果

[雑誌論文] Experience mining : Building a large-scale database of personal experiences and opinions from Web documents2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Two-phased event relation acquisition : coupling the relation-oriented andargument-oriented approaches2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] キーワードサーチを超える情報爆発サーチ-自然言語処理で価値ある未知をマイニング-2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 言語情報間の含意・矛盾関係の認識2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] WWWからの知識獲得2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Extracting Aspect-Evaluation and Aspect-Of Relations in Opinion Mining2007

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 日本語文のモダリティ・極性情報を捉えるために2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] みんなの経験 : プログから抽出したイベントおよびセンチメントのDB化2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Common semantic resources for textual statement extraction and organization2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 言語処理から知に迫る-自然言語処理からの再挑戦-2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 2種類のアンカー情報と共起パターンの組み合わせによる事態間関係獲得2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 経験マイニング:Webテキストからの個人の経験の抽出と分類2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 述語の選択選好性に着目した名詞評価極性の獲得2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 経験マイニングのための事実性解析2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 事態抽出のための事実性解析2008

著者名/発表者名

乾健太郎奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (60272689)