研究概要 |
本研究は,受け係り関係を用いて,単語や句のレベルでの意味的なつながりを獲得し,辞書を構築することを目的としている.このためには,本年度は,受け係り関係と意味のつながりについての調査とともに,より精度の高い解析手法の研究を行った. 本研究では,副詞の意味に注目した.副詞または副詞句の表す意味は,他の品詞に比べて曖昧性が高く,辞書構築において最も大きな問題となることが予想される.本研究では,副詞の係り先の文に含まれる単語とその頻度によって,副詞を分類し,シソ-ラスを構築するという手法を取った.ただ,このままでは,人間が理解できるような階層構造は得られないので,多頻出副詞に関しては既存のシソ-ラスを用い,あらかじめ分類木を作成ししておく.これを用い,係り先の単語を用いて,新たに副詞の分類木上での位置を決定する.その結果,副詞を分類する要素としては,助動詞及び助詞が強力であり,頻度が60回以上であれば,平均して上位分類から70%程度の意味を推測できることが分かった.ただ,個々の副詞の特徴がよく反映されているとは言えず,課題として残される. 日本語の係り受け解析を行うにあたり,形態素解析は最初の段階であり,解析精度の向上が要求される.自動的な辞書構築に関連して,形態素解析や構文解析の精度を向上することが必要である.本研究では,本年度は形態素解析の精度を向上するための研究を行った.コーパスから得られる頻度情報の信頼性を統計的に検定し,有意な情報でなければ,周辺の品詞情報から推定する.この手法によって,単語の品詞付けに関して97%以上の形態素解析精度を得ることができた. 更に,言い換えを行うことにより人間が効率的に意味的曖昧性を解消する手法について研究を行った.これは,英日翻訳などへの適用を予定している.
|