研究概要 |
本研究では岩波情報科学辞典を対象として,利用者が自然言語で任意の質問文を入力した時に,適切な辞書項目を選択して表示するというシステムの作成を目標とした. 当初は自然言語の質問文を計算機処理し,必要であれば利用者との対話を行なうことによって,その質問文の意図を明確にするというシステムの構築を試みた.しかし,種々の自然言語質問文を収集・調査した結果,その文体の多様さのために現時点でそのような対話的システムを構築することは困難であることがわかった. そこで,現在の形態素解析技術,全文検索技術で実現可能である方法として,質問文の中から自立語を自動的に取り出し(これらを検索語と呼ぶことにする),検索語をできるだけ多く含むような辞典項目を取り出すという方法を考案した.さらに,単に一項目で検索語を多く含んでいるというのではなく,関連性をもった項目の集合(岩波情報科学辞典では項目語間の上位語・下位語のシソ-ラスが与えられている)として検索語を多く含んでいる部分を優先するという方法により,質問文に対して適切な項目がうまく取り出せることを明らかにした. 質問文中の語と項目説明文との関係を調べることは質問文自体の解析の手がかりとして有効であり,このことによって質問文中の重要な部分とそうでない部分との区別などが明確になってきた.今後はこの成果を質問文自体の計算機処理,質問文に関する利用者との対話処理などへ発展させる予定である.
|