1999 Fiscal Year Annual Research Report
統計的手法とヒューリスティックスを融合した自然言語文の統語的曖昧さ解消法
Project/Area Number |
11780280
|
Research Institution | Kyushu University |
Principal Investigator |
冨浦 洋一 九州大学, 大学院・システム情報科学研究科, 助教授 (10217523)
|
Keywords | 自然言語処理 / 構文解析 / 曖昧さの絞り込み / 確率文脈自由文法 / 仮説検定 / 言語コーパス |
Research Abstract |
自然言語文の構文解析における大きな課題は,入力文に対する構文構造の曖昧さの絞り込みである.統計的手法では,確率文脈自由文法などの統計的言語モデルにより,入力文の可能な構文木の生起確率を求め,これに基づいて構文木間に優先順位を付与する.モデルの確率パラメータは,構文解析済みの言語コーパスを標本として推定されるが,それほど大規模でない標本から推定されたパラメタ値の信頼度は一様ではなく,また,標本の大きさにも依存する.本研究は,入力文の可能な構文木の生起確率による順位付けに対する誤り率を求め,この値により,生起確率による構文木の絞り込みとヒューリスティックによる構文木の絞り込みを選択する手法を開発することを目的としている. 今年度は,入力文の可能な構文木T_1,T_2の生起確率の比が,P(T_1):P(T_2)=p(δ_1):p(δ_2)のように,1組の生成規則〈δ_1,δ_2〉の適用確率(パラメタ)の比になる単純な場合の,P(T_1),P(T_2)の大小関係の判定の誤り率を求める手法を開発した.基本的には,この問題は二つの二項母集団の母比率の大小関係の仮説検定問題に帰着される.二項母集団の母比率の大小関係の仮説検定は,二項分布を正規分布近似して行うが,本研究で対象としているのは標本の大きさがそれほど大きくない場合であり,正規分布近似はできない.そこで,ある仮定の下で,正規分布近似をしないで二つの母比率の大小関係の仮説検定を行う手法を開発した.さらに,英語の前置詞句の係り先の曖昧さ解消問題に対して,本手法を適用した実験を進めている.
|
Research Products
(1 results)