• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

風評被害対策に向けた情報の重要度を決める要因の抽出・分析と重要度の自動推定

研究課題

研究課題/領域番号 19700154
研究機関独立行政法人情報通信研究機構

研究代表者

村田 真樹  独立行政法人情報通信研究機構, 知識創成コミュニケーション研究センター言語基盤グループ, 主任研究員 (50358884)

キーワード情報の重要度 / 自然言語処理 / 新聞データ / 被験者データ / テキストマイニング / 教師あり機械学習
研究概要

本年度はユーザ個人が考える情報の重要度に関する研究を行った。ユーザ同士の判断の一致度を知るために、記事ペアにおいてどちらの記事が重要であるかのユーザによる判定についてKappa値を計算した。Kappa値は0.08という非常に低い一致度の値が得られた。このことからどういう情報を重要と考えるかは人によって異なることがわかった。教師有り機械学習法を用いた実験により、個々のユーザが二つの記事のうちどちらが重要であると判断するかを65%前後の精度で予測できることがわかった。アンケートにおいて答えてもらったユーザ個人の興味情報と、教師有り機械学習により得られた各個人が重要と考える事柄の一致具合を検証した。興味情報が機械学習で重要とされた上位500個の単語の方と有意に重なりが多かった被験者は53人で、下位500個の単語の方が重なりが多かった被験者は2人であった。53人と2人は検定で有意差があるため、ユーザ個人の興味情報が、そのユーザの重要な記事の判断と相関があることがわかった。教師あり機械学習の学習過程で得られるパラメータの情報から、男性は「トヨタ」「野球」を女性は「出産」「懐妊」という事柄を重要と考えていることがわかった。これらの単語が示すものは情報の重要度に大きな寄与をしているものと思われる。この知見は今後の重要度推定システムの構築に役立つものである。情報の重要度の推定処理の応用および発展を目指して特許文書中で特に重要な箇所である請求項とその実施例の比較と対応付けの研究も行った。

  • 研究成果

    (4件)

すべて 2009 2008

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件) 産業財産権 (1件)

  • [雑誌論文] System Displaying Differences between Claims and Matching of Claims with Corresponding Parts in Embodiments2008

    • 著者名/発表者名
      村田真樹
    • 雑誌名

      Journal of Information 11

      ページ: 407-425

    • 査読あり
  • [学会発表] ユーザ個人の興味の影響を考慮した情報の重要度を決める要因の抽出・分析2009

    • 著者名/発表者名
      村田真樹
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取大学
    • 年月日
      2009-03-04
  • [学会発表] Analysis of the Degree of Importance of Information Using Newspapers and Questionnaires2008

    • 著者名/発表者名
      村田真樹
    • 学会等名
      国際会議 IEEE NLPKE-8
    • 発表場所
      北京、首都師範大学
    • 年月日
      2008-10-20
  • [産業財産権] 情報の重要度推定システム及び方法及びプログラム2008

    • 発明者名
      村田真樹
    • 権利者名
      独立行政法人情報通信研究機構
    • 産業財産権番号
      特許権, 特願2008-134888
    • 出願年月日
      2008-05-23

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi