2014 Fiscal Year Research-status Report
Project/Area Number |
25730136
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
NEUBIG Graham 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (70633428)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 機械翻訳 / 訳選択 / 自然言語処理 / 機械学習 / 評価尺度 |
Outline of Annual Research Achievements |
本年度は主に訳選択の根拠の自動発見技術と、訳選択の根拠を考慮した翻訳システムの構築に取り組み3つの成果があった。 成果1は、現在の翻訳システムが引き起こす誤りを効率的に分析する手法である。具体的な手法として、システムが出力した訳出結果と実際に人間が作成した正解訳を比較し、体系的に異なる箇所を誤りの可能性が高いとして指摘する。評価の結果、従来の分析法に比べて、効率的に誤りを発見することができることが分かった。この技術を成果2の分析の際に使用している。 成果2は、2種類の訳選択誤りの分析である。1種類目は、翻訳システムによって1つの単語の訳を生成させ、翻訳者に分析させたものである。2種類目は実際に様々なシステムに文を生成させ、その誤りを分析したものである。この分析の結果、訳選択の根拠や、訳選択が実際のシステムで失敗するケースを明らかにした。具体的には、語義曖昧性による訳選択の失敗は述語と項の関係や、口語か文語などのスタイルが重要な要因であることが分かった。 成果3は、ルールベースシステムが使っているような処理を統語情報を用いた統計翻訳への反映手法である。具体的には「は」「が」「を」などの助詞を選択する根拠を中心に、人間により記述したルールを導入した手法1つと、対訳データから自動学習した手法1つを調査した。具体的には、名詞句が主語を表しているか、目的語を表しているかを構文解析の結果に基づいて特定し、適切な助詞を入れやすくするように統計翻訳の入力を編集するルールを作成した。システムへの導入の結果、英日翻訳において、助詞を翻訳する精度が大幅に向上した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
26年度の目標はおおむね順調に達成している。 訳選択の根拠の調査に関して、2種類の調査を行い、有用な知見を獲得した。その中で、語義の曖昧性、原言語に含まれない単語の誤訳、単語の誤削除などを問題として特定し、これらの問題の解決策について考察した。 訳選択の根拠の自動発見技術と翻訳への反映に関して、英日翻訳における助詞の選択という、原言語に含まれない情報の代表において、確実な成果を上げている。従来の統語情報に基づく統計的機械翻訳と比較して、大幅な精度向上を実現しており、有用性が確認されている。 また、当初の予定に含まれていなかったが、分析を行っている内に必要性が明らかとなった誤り分析の効率化技術に関する研究も行われた。
|
Strategy for Future Research Activity |
27年度において、主に2つの課題に取り組む予定である。 まずは、訳選択の根拠の自動発見と翻訳システムへの反映を更に一般化する予定である。26年度で英日翻訳の助詞の翻訳で有用性が確認された枠組みを、更に文駅の結果で明らかになった他の誤り原因へと拡張する予定である。例えば、名詞や動詞の語彙選択や、主語の補完などが挙げられる。 また、27年度の予定であった訳選択の安定性を評価する評価尺度の開発にも取り組む。具体的には、訳選択の安定性を評価するために作られたデータに基づく尺度と、自然発生する翻訳データに基づく尺度という2種類の尺度を検討する。
|
Causes of Carryover |
若干の残高が残ったが、ほぼ予定通りに予算を執行している。
|
Expenditure Plan for Carryover Budget |
今年度は当初の予定通り、システムの評価やデータの作成、成果発表のための旅費などを中心に、従来の予算と合わせて使用していく予定である。
|
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] 統語ベース翻訳に対する統語的前処理の適用2014
Author(s)
波多腰 優斗, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
Organizer
情報処理学会 第217回自然言語処理研究会(SIG-NL)
Place of Presentation
オホーツク文化交流センター(北海道網走市)
Year and Date
2014-07-03
-
-
-
-
-