1997 Fiscal Year Annual Research Report
語義の曖昧性解消に基づく文書の自動分類とその分類名の自動生成
Project/Area Number |
09780322
|
Research Institution | University of Yamanashi |
Principal Investigator |
福本 文代 山梨大学, 工学部, 助手 (60262648)
|
Keywords | コーパス / 統計手法 / 文脈依存性 / 重要語 / 類似度 |
Research Abstract |
本研究では語義の曖昧さ解消結果の有効性を示すために解消結果を情報検索の分野に適用した.具体的には文書の重要部分の抽出方法に関する提案を行なった.本研究でアピールする点,特に関連する研究との差異に注目した特徴は以下の通りである. 文脈依存の度合,すなわち,記事中の任意の語が,設定された文脈にどのくらい深く関わっているかという度合の強さを用いることで重要語を抽出する 従来より提案されている研究は,(a)ヒューリスティックスを用いたもの,(b)単語頻度などの情報を用いたもの,(c)シソ-ラスなどの意味情報を用いたものがある.(a)は対象分野が限定されてしまう,(b)は精度面,(c)はデータスパースネスの問題がそれぞれ指摘されている.本研究ではこの問題に対処するため,文書がどの分野に強く依存しているかという度合を用いることでその文書の重要語を抽出した(論文1参照). 実験では,人手により抽出したパラグラフと比較した結果,抽出率を30%とした場合,50記事の抽出総パラグラフ数84に対し,75パラグラフが正解であり正解率は89.2%に達した(論文2参照).
|
-
[Publications] 福本文代,福本淳一,鈴木良弥: "“文脈依存の度合に基づくパラグラフの抽出"" 自然言語処理,言語処理学会. 4・2. 89-110 (1997)
-
[Publications] F.Fukumoto, Y.Suzuki and J.Fukumoto: "“An Automatic Extracrion of Key Paragraph Based on Context Dependency"" 5th Applied Natural Language Processing(ANLP'97). 291-298 (1997)