2009 Fiscal Year Annual Research Report
非線形言語モデルによる日本語単文の意味解析基盤技術
Project/Area Number |
19300049
|
Research Institution | Tottori University |
Principal Investigator |
村上 仁一 Tottori University, 工学研究科, 准教授 (90304196)
|
Co-Investigator(Kenkyū-buntansha) |
徳久 雅人 鳥取大学, 工学研究科, 講師 (10274557)
|
Keywords | 単語モデル / 非線形性 / 文型パターン / 単文 / 機械翻訳 / 統計翻訳 |
Research Abstract |
H21年度は、文型パターン辞書を用いた応用研究として、文型パターンと統計翻訳を融合した翻訳方式の研究と、パターン辞書を用いた情緒処理方式の研究に重点をおいて研究した。 1)機械翻訳 現在,世界的にみると、機械翻訳において統計翻訳が注目されている.統計翻訳では一般にN-gramモデルを用いる.N-gramモデルは局所的な文法情報であるため,特異な翻訳文が生成される場合がある.そこで,まず日英文パターン辞書を用いて日英パターン翻訳を行い,文法構造を英語に近づける.そして出力文に対し,統計翻訳でさらに英英翻訳を行う.この日英文パターンが持つ大局的な文法情報を用いることでN-gramモデルにおける局所的な構文問題が解消でき,翻訳精度の向上が可能であると考えられる。 この仮定にそって研究した結果、日英文パターン辞書における変数の個数が少ない場合には,翻訳精度が向上した.しかし変数の個数が多い場合には,翻訳精度が低下する結果となった.この問題に対応するためには、パターン翻訳における翻訳精度を向上する必要があることがわかった。 2)情緒処理 昨年までは、日本語語彙大系に収録されている結合価パターンに対し,情緒生起の原因に関する情報を付与して,辞書が作成された.しかし,情緒推定の際,過剰な推定が行われることが問題であった.そこで,本稿では,用言の語義だけではカバーできていない情緒的要因のうち,人物や事物の間の「接近」と「解離」の関係に着目し,辞書を改良した. のべ11,712件のパターンを検査した結果,23%は用言の語義だけで情緒原因をカバーでき,60%は接近/解離の関係条件で情緒原因をカバーできた.そして,新たな条件が必要なパターンは17%にとどまることか分かった。
|
Research Products
(14 results)