近年のインターネット普及により、電子情報管理と検索システムの重要性は非常に高く、より利便性の高いシステムが求められている。本研究では、特にコンピュータと人間との対話処理においての話題の焦点を理解した知的な対話処理を目指し、本年度は単語の類似性判定技術の研究及び流行話題類推の研究を行った。 1.情報検索での分野類推・類似検索などに応用できる語彙情報の類似性判定法の研究 従来の類似性判定は、複数の単語同士が同じ傾向(=近い話題分野、出現頻度など)をもって出現するという類似情報《正の類似性》のみを利用していたが、裏を返せば、同じ傾向をもっていない情報《負の類似性》は、類似性をさらに強くする因子となる。本年度はこの《正の類似性》と《負の類似性》とを融合した精度の高い単語の類似性判定方法を研究した。まず分野別に分類した大規模な文書集合を収集するため、分野別文書をWEBページから自動的に収集するシステムを開発し、収集した文書集合を利用し単語の《正の類似性》と《負の類似性》を融合した類似性判定システムを構築した。 2.語彙の流行性を決定する話題類推技術の研究 語彙の流行性を決定する技術を確立するため、常に新しい単語と古い単語(死語)のデータを収集し、決定木を利用して単語の流行性判定法を研究した。 上記研究により、知的対話システムのための汎用的な語彙の類似性と流行性判定技術を確立した。なお、本年度の提案手法に関連する研究成果は、別記した研究発表雑誌論文(4本)や、アメリカ、タイで行われた国際会議でのフォーラム論文(7本)にて報告済みである。
|