研究概要 |
本年度は言語処理単位の予備的検討を行った。まず、これまでの自然言語処理分野における様々なタスクで処理の単位がどのように設定されているかの調査を行った。調査の結果、表層的な自然言語処理タスク、すなわち統計情報を元に処理を行うタスク、及び入力文などの言語表現をベクトルなどで表現して当該言語表現の意味を測定する場合のタスクにおいては、形態素解析の結果得られる内容語をそのまま使用している場合が多いことが明らかになった。 次に、具体的な事例として形容性のある構文片,例えば「ズレがある」「ぞっとする」などについて検討を行った。一般に、これらは意味的に一まとまりの語句と考えられているが形態素解析結果では2形態素または3形態素で表現され、明らかに人間の感覚とずれがある。このような機能動詞を含む構文片のうち、どれが意味的に一まとまりとなるのか、あるいはどのような規則性があるのかについて検討を行った。また、同時に意味的なまとまりをもつ構文片の収集を1年を通して継続的に行っている。この成果は本研究課題終了後に公開する予定である。
|