2007 Fiscal Year Annual Research Report
言語処理の高度化に向けた言語推論に基づく複数文の意味解析法に関する研究
Project/Area Number |
19650028
|
Research Category |
Grant-in-Aid for Exploratory Research
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
島津 明 Japan Advanced Institute of Science and Technology, 情報科学研究科, 教授 (60293388)
|
Co-Investigator(Kenkyū-buntansha) |
中村 誠 北陸先端科学技術大学院大学, 情報科学研究科, 助教 (50377438)
|
Keywords | 自然言語処理 / 法令工学 / 意味解析 |
Research Abstract |
言語処理の高度化に向けて,文書中の語句に基づく言語推論により複数文の意味を求めるための研究を進めた。ここで複数文というのは,一つの文の情報だけでは伝える情報が不完全となる文の集合を指す。算数の文章題がそのような例である。本研究が特に対象とするのは,複数文の意味を論理、形式表現するとき,一文単位の論理、形式表現を並べただけでは,複数文の論理、形式表現としては適切とは限らない場合である。例えば,複数文として参照表現を含む文と被参照表現を含む文とからなる複数文に対しては,参照内容を論理、形式表現に反映させる必要がある。本研究では特に法令文書の複数文を対象にする。 本期間は,国民年金法(215条)を対象に,複数文として,箇条書きの号として表現される文とそれらを参照する文,他条文を参照する文と参照先の文とを取り上げ,各表現を分析し,どのような場合があるかを分類した。国民年金法215条中,34箇所に箇条書きがあり,キーとなる語や参照表現のパターンを調べ,表現形態を明らかにした。他条文を参照する表現も分類しその形態を明かにした。これらの分析に基づき,号を参照する語と号の主辞を照合し,参照部分を号の必要部分で置き換え,これを言語解析システムに適用して,適切な論理、形式表現を求める方法を提案し,システムを作成した。号の参照部分に関する置き換え処理のクローズドテストは約73%が正解でり,所得税法によるオープンテストは約50%の正解率であった。精度はプログラムの詳細化により上がると考えている。
|