1998 Fiscal Year Annual Research Report
遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法における交叉位置決定手法
Project/Area Number |
09878070
|
Research Institution | Hokkaido University |
Principal Investigator |
荒木 健治 北海道大学, 大学院工学研究科, 助教授 (50202742)
|
Keywords | 遺伝的アルゴリズム / 帰納的学習 / 機械翻訳 / 交叉位置 / 品詞 / 旅行者用英会話 / 文脈 / 上位概念 |
Research Abstract |
実用的な機械翻訳システムの実現に向け,実例から翻訳ルールを帰納的に学習し,翻訳を行う遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法を開発し、研究を行っている。本手法では、交叉により新例文を生成する過程で大量の誤った例文が生成され,その淘汰が間に合わず結果として大量の誤った翻訳ルールを生成するという問題点がある.この問題に対し,本研究課題では特に交叉位置の決定に字面,出現位置,上位概念,訳語,品詞情報などの種々の情報を利用することにより交叉位置の精度を高めるという手法を開発することを目的としている.本年度は,初年度に開発した交叉位置決定手法を用いて,大量のデータを用いた評価実験,考察を行い,それを基に本手法の改良を行う.具体的には,生成された例文の精度の評価を行い,さらにその結果が翻訳結果に与える影響について考察する.特に,交叉する対象と交叉位置を決定する際に用いられる類似度がどのくらいの点数の時が最適な翻訳結果が得られるのかを実験により解明を行った.この結果,類似度のしきい値を55とした場合に,最も多くの正翻訳例が生成されることが確認された.また,これとは別により実用的なデータを用いて本システムを評価うするために,対象データとして,前年度に行った中学1年生用の英語の教科書から一歩進め,より実用的なデータとして旅行者用英会話文を用いた.旅行者用英会話文を用いる理由は,会話文では特に省略や文脈に依存した文が多く,既存の商用の解析型翻訳システムでは,うまく訳せないことが多いが,本手法を用いるとその表現様式を学習することにより既存の商用システムでは訳せない文も訳すことができるようになるものと考えたためである.そのことを評価実験を行い確認した結果,市販の商用システムよりも高い精度で良質な翻訳が行えることが明らかになった.
|
Research Products
(6 results)
-
[Publications] Yoshitaka SATO: "A Method for Resolving Cohesive Relations of Unknown Words in Text Structure" Proceedings of the IASTED International Conference Artificial Intelligence and Soft Computing. 179-182 (1998)
-
[Publications] Hisayuki SASAOKA: "Evaluation of Prediction Method of Target Words Using Inductive Learning" Proceedings of the IASTED International Conference Artificial Intelligence and Soft Computing. 183-186 (1998)
-
[Publications] 森 英悟: "帰納的学習を用いた表層文から意味表現への変換規則の自動獲得と適用" 電子情報通信学会論文誌 D-II. Vol.81-D-II No.7. 1621-1630 (1998)
-
[Publications] 笹岡 久行: "帰納的学習を用いた訳語選択手法の派生語および複合語における有効性の評価" 電子情報通信学会論文誌 D-II. Vol.81-D-II No.9. 2146-2158 (1998)
-
[Publications] Tantely Andriamanankasina: "Sub-Sentential Allgnment Method by Analogy" Proceedings of the 13th Pacific Asia Conference on Language,Information and Computation. 277-284 (1999)
-
[Publications] Hiroshi Echizen-ya: "A Study of Performance Evaluation for GA-ILMT Using Travel English" Proceedings of the 13th Pacific Asia Conference on Language,Information and Computation. 285-292 (1999)