研究概要 |
本研究の目的は,科学技術抄録文の理解システムを実現するための基礎を確立することである. 自然言語理解における最大の問題は,文脈自由文法に基づいて統語解析を行うと,きわめて多数の曖昧さが生じることである.この曖昧さは,意味的制約により除去することが一般的であるが,科学技術知識に関する意味的制約の作成は非常に困難である.本研究のアプローチでは,専門用語の意味を扱わないので,統語解析のみで文を意味構造へ変換する技術を開発をすることが必要である.そこで,本研究では,単文を原子論理式に変換するために,単文の動詞句の決定と名詞句の範囲決定の研究を行った. 動詞句の決定法 本研究の動詞句決定法は,動詞句候補選出手続きと動詞句決定手続きから成る.動詞句候補選出手続きでは,正規文法によって動詞句候補を選出する.動詞句決定手続きでは,動詞句候補に優先度をあたえ,最高優先度をもつ候補を動詞句とするものである.優先度は,(1)助動詞区,(2)be動詞とhave動詞,(3)単品詞機能語動詞,(4)多品詞機能語動詞,(5)常用語動詞,(6)その他,とした.この決定法により96%の精度で動詞句を正しく決定できる. 名詞句の決定法 名詞句の決定を困難にしている原因のひとつに,名詞による名詞の修飾があげられる.そこで,まず,文中の被修飾名詞を決定する技術の開発を行った.この決定法により,96%の被修飾名詞を決定できる.さらに,得られた疑似コーパスに基づき,単語が被修飾名詞として出現する確立を算出し,これを利用して連言問題を解決する見通しを得た.
|