語義の曖昧性解消に基づく文書の自動分類とその分類名の自動生成
Project/Area Number |
09780322
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | University of Yamanashi |
Principal Investigator |
福本 文代 山梨大学, 工学部, 助教授 (60262648)
|
Project Period (FY) |
1997 – 1998
|
Project Status |
Completed (Fiscal Year 1998)
|
Budget Amount *help |
¥2,300,000 (Direct Cost: ¥2,300,000)
Fiscal Year 1998: ¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 1997: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | 文書の自動分類 / 多義語の曖昧性の解消 / 統計手法 / 名詞同士のリンク付け / コーパス / 文脈依存性 / 重要語 / 類似度 |
Research Abstract |
本研究では語義の曖昧さ解消結果の有効性を示すために解消結果を情報検索の分野に適用した.具体的には文書の自動分類に関する提案を行なった.本研究でアピールする点,特に関連する研究との差異に注目した特徴は以下の通りである. ・多義解消の精度を挙げるため,教師なし学習のアルゴリズムを適用することで動詞の意味を特徴付ける共起関係を自動的に抽出する手法を提案した(論文1参照) ・従来より提案されている文書の自動分類の研究は,(a)ヒューリスティックスを用いたもの,(b)単語頻度などの情報を用いたもの,(c)シソーラスなどの意味情報を用いたものがある.(a)は対象分野が限定されてしまう,(b)は精度面,(c)はデータスパースネスの問題がそれぞれ指摘されている.本研究ではこの問題に対処するため,文書がどの分野に強く依存しているかという度合を用いることでその文書の重要語を抽出した(論文2,3参照). 実験では,78個の分野に属するWall Street Journal 4,453の文書に対し,Lewisらによって提案されたProportional assignment strategyによるBreakeven Pointsで0.75の正解率が得られた(論文2参照).
|
Report
(2 results)
Research Products
(5 results)