1998 Fiscal Year Annual Research Report
語義の曖昧性解消に基づく文書の自動分類とその分類名の自動生成
Project/Area Number |
09780322
|
Research Institution | University of Yamanashi |
Principal Investigator |
福本 文代 山梨大学, 工学部, 助教授 (60262648)
|
Keywords | 文書の自動分類 / 多義語の曖昧性の解消 / 統計手法 / 名詞同士のリンク付け |
Research Abstract |
本研究では語義の曖昧さ解消結果の有効性を示すために解消結果を情報検索の分野に適用した.具体的には文書の自動分類に関する提案を行なった.本研究でアピールする点,特に関連する研究との差異に注目した特徴は以下の通りである. ・多義解消の精度を挙げるため,教師なし学習のアルゴリズムを適用することで動詞の意味を特徴付ける共起関係を自動的に抽出する手法を提案した(論文1参照) ・従来より提案されている文書の自動分類の研究は,(a)ヒューリスティックスを用いたもの,(b)単語頻度などの情報を用いたもの,(c)シソーラスなどの意味情報を用いたものがある.(a)は対象分野が限定されてしまう,(b)は精度面,(c)はデータスパースネスの問題がそれぞれ指摘されている.本研究ではこの問題に対処するため,文書がどの分野に強く依存しているかという度合を用いることでその文書の重要語を抽出した(論文2,3参照). 実験では,78個の分野に属するWall Street Journal 4,453の文書に対し,Lewisらによって提案されたProportional assignment strategyによるBreakeven Pointsで0.75の正解率が得られた(論文2参照).
|
-
[Publications] 福本文代,鈴木良弥: "類推に基づく語の重み付け学習を用いた動詞の多義解消" 情報処理学会論文誌. 39,12. 3187-3199 (1998)
-
[Publications] 福本文代,鈴木良弥: "語の重み付け学習を用いた文書の自動分類" 情報処理学会論文誌 採録決定,. (1999)
-
[Publications] F.Fukumoto Y.Suzuki: "′An Empirical Approach to Text Categorization based on Term weight Learning′" Proc.of the 3rd Empirical Method in Natural Language Processing. 71-79 (1998)