多様なドメインの文、文書の内容理解を効率的に行うことは自然言語処理の重要な課題である。ここではハッシュ法や行列分解に基づく手法によりこれらの課題解決に取り組んだ。まず、新聞記事の談話構造を高速、かつ、高精度に解析する手法を考案し、文書要約での有効性を示した。また、音声対話/新聞データを対象とした高速かつ高精度な単語省略補完システムを考案し、崩れた文の整形が行えるシステムを開発した。さらに、単語シソーラスを使った単語の類似度検索を高速、かつ、高精度に行う手法を考案した。これらは文、文書の高度な内容理解を行うもので、今後も自然言語処理の様々なアプリケーションへの応用が期待される。
|