2002 Fiscal Year Annual Research Report
大規模な日英対訳コーパスから対訳文型パターンを自動獲得するためのプログラムの研究
Project/Area Number |
12558035
|
Research Institution | Tottori University |
Principal Investigator |
池原 悟 鳥取大学, 工学部, 教授 (70283968)
|
Keywords | 機械翻訳 / 自然言語処理 / 文型パターン / 知識自動獲得 |
Research Abstract |
今年度は、主として「日英対訳用例収集とその文型パターン化作業」、「意味類型化方式の検討」、「被覆率測定のための文型パターン照合プログラム試作」の3種類の課題に取り組んだ。 このうち、第1の作業では、まず、昨年度収集した45万件の日英対訳例文に新たに55万件を収集追加し、合わせて100万件の日英対訳例文ファイルを作成した。次に、収集した55万件の例文から、文型パターン化の対象となる重文・複文10万件を抽出し、昨年度抽出した例文5万件と合わせて15万件の標本例文集を作成した。次に、文法レベルでの文型パターン記述方式を検討し、文型パターン記述言語の言語仕様を定めた。最後に、それに従って上記15万件の対訳例文を対象とする単語レベル、句レベルの汎化作業を行い、それぞれ13万件、10万件の日英文型パターンを作成すると同時に、一部、節レベルの汎化作業も行った。 第2の検討では、因果関係を中心とした500例文を対象とした例題検討や因果関係以外の例文を含む250例文の意味記述などを行い、様々な観点から文型パターンの意味類型化の方法を検討した。 第3の試作では、少数の文型パターンから最終的な被覆率を予測する方法を検討する一歩、実験的に被覆率を求めるための文型パターン照合アルゴリズムを検討しプラム開発を行った なお、このほかにも、究極的な機械翻訳の原理に迫るための言語表現と概念の関係に関する検討のほか、実験用もしくは、文型パターン補充用の対訳文1万件の準備などを行った。
|
-
[Publications] 池原 悟: "究極の翻訳方式の実現に向けて =類推思考の原理に基づく翻訳方式="AAMT Journal. No.33. 1-7 (2002)
-
[Publications] 池原悟, 村上仁一, 宮本健司: "「AのB」型名詞句の日英翻訳規則について"情報処理学会論文誌. Vol.43, No.7. 2300-2308 (2002)
-
[Publications] 池原悟, 村上仁一, 的場和幸: "日英機械翻訳のための時間表現の意味と対応関係の解析"情報処理学会論文誌. Vol.44, No.2. 451-465 (2003)
-
[Publications] 池原悟, 佐良木昌, 宮崎正弘, 池田尚志, 新田義彦, 白井諭, 柴田勝征: "等価的類推思考の原理による機械翻訳方式"電子情報通信学会、言語と思考研究会. TL2002-34. 7-12 (2002)
-
[Publications] 道祖尾太祐, 村上仁一, 徳久雅人, 池原悟: "日英対訳パターンの自動抽出について"情報処理学会、自然言語処理研究会. NL-153-15. 113-118 (2003)
-
[Publications] 金出地真人, 徳久雅人, 村上仁一, 池原悟: "結合価文法による動詞と名詞の訳語選択能力の評価"情処研報、自然言語処理研究会. 2003-NL-153-16. 119-124 (2003)