1998 Fiscal Year Annual Research Report
Project/Area Number |
09680370
|
Research Institution | KYUSHU UNIVERSITY |
Principal Investigator |
日高 達 九州大学, 大学院・システム情報科学研究科, 教授 (30037931)
|
Co-Investigator(Kenkyū-buntansha) |
市丸 夏樹 九州大学, 大学院・システム情報科学研究科, 助手 (80274497)
冨浦 洋一 九州大学, 大学院・システム情報科学研究科, 助教授 (10217523)
|
Keywords | 複合化確率文法 / 確率文法 / 確率パラメタ推定式 |
Research Abstract |
確率文法は,自然言語処理において構文解析で発生する曖昧さを解消する一つの手段として用いられているが,一組の確率パラメタで構文解析の正解率を上げるには限度がある.この問題に対処するため,m組の確率パラメタで確率文法を複合化した複合化確率文法で正解率の向上を計る手法の開発が本年度の研究目的であり,以下の研究成果を得た. 1. 複合化確率文法モデルの提案 確率文脈自由文法の近似性能を向上するための複合化モデルを提案した.複合化することにより尤度の向上が計れることを示し,また複合化度mおよびm組の確率パラメタ推定式をBaumの不等式を用いて導いた. 2. 複合化確率文法の構文解析アルゴリズム 確率文脈自由文法の高速構文解析機であるEarleyの手法を拡張して複合化確率文法モデルの構文解析アルゴリズムを構成した. 3. 複合化確率文法による正解率向上の検証 曖昧な構文構造を生成する文を収集し,正解の構文構造をランダムに選出して,標本集合とし,標本集合からm組の確率パラメタを(1)の推定式に基づいて算出し,(2)の構文解析手法により構文解析を行なって正解率を実験的に算定した.その結果,単独の確率文法を用いることに較べ,複合化確率文法の場合に正解率の向上が顕著であることを実証した.
|
Research Products
(6 results)
-
[Publications] 日高 達: "統計的手法を用いた名詞句「NPのNP」の意味関係の抽出法" 電子情報通信学会「言語理解とコミュニケーション」研究報告(NLC). 98・53. 23-29 (1998)
-
[Publications] 日高 達: "述語文節間の係り受けを考慮した係り受け文脈自由文法" 電子関係学会九州支部第51回連合大会講演論文集. 282 (1998)
-
[Publications] 冨浦洋一: "係り受け文脈自由文法の強化法" 電子関係学会九州支部第51回連合大会講演論文集. 283 (1998)
-
[Publications] 日高 達: "複合化確率文脈自由文法の評価" 電子関係学会九州支部第51回連合大会講演論文集. 285 (1998)
-
[Publications] 冨浦洋一: "確率係り受け文脈自由文法の効率的パーザの作成" 電子関係学会九州支部第51回連合大会講演論文集. 286 (1998)
-
[Publications] 日高 達: "係り受けを考慮した機械翻訳を行なうための翻訳文法" 電子関係学会九州支部第51回連合大会講演論文集. 287 (1998)