研究概要 |
未登録語処理の際,文字列の単語らしさ評価を可能とする造語モデルの改良・強化についての研究を行った. 従来は,名詞を主な対象として,機械的処理だけで構築可能なモデル化を行い,良好な結果を得ていた.しかし他の品詞については,評価実験の結果,モデルの利点を十分には生かせなかった.よって,ある程度の人手を構築に要することを許容し,造語モデルの改良のために,動詞の造語についての分析を行った. 動詞の造語モデル作成において,最初の段階では,動詞の活用形に関する性質は語幹末尾の造語単位の音韻性質のみに依存すると予想した.しかし調査の結果,和語動詞では,従来の文法の観点では音韻的性質以外を扱われていなかった語尾部が,実際には語義を変化させる機能を持つ造語成分と真に音韻を整えているだけの成分とから構成されていると考えるべきであるとの知見を得た.すなわち,基礎概念となる語基(概念語基)に語性を変化させる語基(機能語基)が結合することで語が形成され,それに語尾としての音韻要素が接続することにより,語として音韻的にも安定すると考える.従来の語幹・語尾の考え方はこの機能語基の扱いが十分ではないと言えることがわかった.この考え方により,不必要な造語単位数の増大を避けることができ,確率モデルとしてのパラメータ推定をより容易にすることができる. さらに,この分析を基盤として,複合語造語モデルの構築にむけて,和語複合動詞が人に受容可能となる条件の分析を行った.未知語造語能力を適切に持たせるためには,人が許容する最低限の制約を見出すことが望ましいが,分析によって,そのような制約の一部と考えられる性質を得た. 現在は,モデル完成に向けて,これらの分析をさらに進めている最中である.
|