• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

文書集合における潜在的意味に着目した特徴量選択手法の提案について

研究課題

研究課題/領域番号 20860085
研究機関東京都立産業技術高等専門学校

研究代表者

横井 健  東京都立産業技術高等専門学校, ものづくり工学科, 助教 (40469573)

キーワード特徴量抽出 / 自然言語処理 / テキストマイニング / トピック抽出 / 情報フィルタリング
研究概要

平成21年度は平成20年度に開発した大規模文書集合におけるトピック抽出方法とそれらを用いた索引語選別手法のより深い検討と選別された索引語(特徴量)を情報フィルタリングへ応用することで、上記の索引語選別手法の有用性を検証した。まず、索引語選別手法のより一層の検討では、索引語選別の基となるトピックの抽出方法や結合方法、トピック数、また、結合の様子などを観察することで、その特性を検証した。また、平成20年度に実施した検証とは違ったデータを用いた検討も実施した。次に、トピックに基づいた索引語選別の有用性を検証するために、選別された索引語を用いて文書の新たな表現を行い、その表現方法の上でユーザの興味情報に基づいた情報フィルタリング手法を適用した。その結果、上記のトピックに基づいて選別された索引語を用いた情報フィルタリング手法は、MEDLINEを用いた実験において、単語の出現頻度に基づいた索引語選別やすべての索引語を用いた手法、また、従来次元圧縮で利用されているLSA(Latent Semantic Analysis)と比較を行ったところ、フィルタリング精度の改善を確認することができた。この結果、本研究で提案したトピック(潜在的意味)に基づいた索引語選別手法の有用性を確認することができたと考えられる。さらに、上記結果について、論文や学会発表等で研究成果の公表を実施した。
また、上記手法により、今後、インターネットを初めとしたネットワーク上に存在する膨大な文書情報やその他、さまざまな文書情報の整理などにトピックを用いることができるようになると考えられる。

  • 研究成果

    (3件)

すべて 2010 2009

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件)

  • [雑誌論文] Information Filtering using Index Word Selection based on the Topics2009

    • 著者名/発表者名
      T.YOKOI, H.YANAGIMOTO, S.OMATU
    • 雑誌名

      International Journal of Information Technology Vol.5 No.2

      ページ: 81-87

    • 査読あり
  • [学会発表] 分割文書データのNMFによるトピック抽出2010

    • 著者名/発表者名
      筒井昌彦, 横井健
    • 学会等名
      情報処理学会全国大会
    • 発表場所
      東京
    • 年月日
      2010-03-05
  • [学会発表] Topic Extraction for a Large Document Sets with the Topic Integration2010

    • 著者名/発表者名
      T.YOKOI, H.YANAGIMOTO
    • 学会等名
      The 3rd International Conference on Knowledge Discovery and Data Mining
    • 発表場所
      Phuket, Thailand
    • 年月日
      2010-01-09

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi