研究概要 |
本研究は,語義の暖昧さ解消が情報検索において検索の精度向上にどの程度貢献できるかを示すことを目的とする.このため,今年度は,(1)語義の暖昧さ解消を高精度で解消する手法を提案(論文1参照),(2)情報検索のうち文書分類に焦点をあて,分類の精度向上に必要な語義情報を辞書から自的に抽出する手法を提案(論文2参照)を行なった.本研究でアピールする点,特に関連する研究との差異に注目した特徴は以下の通りである. ・教師あり学習を用いた多義解消では,解消に必要な属性を組み合わせて学習を行う方法が多く提案されている.しかし,属性数が多くなると過学習の問題が生じる.本研究では,単語が持つ意味ごとに最適な属性を選択する手法を提案した(論文1参照) ・従来より提案されている辞書情報を用いた文書分類の研究では,辞書の利用が必ずしも分類精度に貢献するとは限らないことが報告されている.そこで本研究では,WordNetを用いて,分類に貢献する辞書情報を機械学習により抽出し,対象コーパスであるReuters-21578において必要な辞書情報,具体的には同義語およびそれらの上位関係について体系的に示した(論文2参照).
|