• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1998 年度 実績報告書

語義の曖昧性解消に基づく文書の自動分類とその分類名の自動生成

研究課題

研究課題/領域番号 09780322
研究機関山梨大学

研究代表者

福本 文代  山梨大学, 工学部, 助教授 (60262648)

キーワード文書の自動分類 / 多義語の曖昧性の解消 / 統計手法 / 名詞同士のリンク付け
研究概要

本研究では語義の曖昧さ解消結果の有効性を示すために解消結果を情報検索の分野に適用した.具体的には文書の自動分類に関する提案を行なった.本研究でアピールする点,特に関連する研究との差異に注目した特徴は以下の通りである.
・多義解消の精度を挙げるため,教師なし学習のアルゴリズムを適用することで動詞の意味を特徴付ける共起関係を自動的に抽出する手法を提案した(論文1参照)
・従来より提案されている文書の自動分類の研究は,(a)ヒューリスティックスを用いたもの,(b)単語頻度などの情報を用いたもの,(c)シソーラスなどの意味情報を用いたものがある.(a)は対象分野が限定されてしまう,(b)は精度面,(c)はデータスパースネスの問題がそれぞれ指摘されている.本研究ではこの問題に対処するため,文書がどの分野に強く依存しているかという度合を用いることでその文書の重要語を抽出した(論文2,3参照).
実験では,78個の分野に属するWall Street Journal 4,453の文書に対し,Lewisらによって提案されたProportional assignment strategyによるBreakeven Pointsで0.75の正解率が得られた(論文2参照).

  • 研究成果

    (3件)

すべて その他

すべて 文献書誌 (3件)

  • [文献書誌] 福本文代,鈴木良弥: "類推に基づく語の重み付け学習を用いた動詞の多義解消" 情報処理学会論文誌. 39,12. 3187-3199 (1998)

  • [文献書誌] 福本文代,鈴木良弥: "語の重み付け学習を用いた文書の自動分類" 情報処理学会論文誌 採録決定,. (1999)

  • [文献書誌] F.Fukumoto Y.Suzuki: "′An Empirical Approach to Text Categorization based on Term weight Learning′" Proc.of the 3rd Empirical Method in Natural Language Processing. 71-79 (1998)

URL: 

公開日: 1999-12-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi