2011 Fiscal Year Annual Research Report
構文構造の異なる言語間での統計的機械翻訳方式に関する研究
Project/Area Number |
11J09312
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
林 克彦 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)
|
Keywords | 構文解析 |
Research Abstract |
計算機によって翻訳を行う機械翻訳は統計的なアプローチの導入によって飛躍的な進歩を遂げた.しかし,日本語と英語のように構文構造が異なる言語間での翻訳精度改善は未だ大きな問題となっている.特に構文構造の違いから起こる単語や句の並び替わりを正確に捉えるには文の構文構造を正確に解析する必要がある.当該年度はこの構文解析をさまざまな言語に対して,高速かつ高精度に行うことができるシステムの作成に従事した.おもな研究成果としては複数の構文解析結果を効率よく格納した空間から高精度な統計的モデルを用いて,多項式時間で最適解を探索する手法の開発である.これは近年の構文解析手法と比べて,ほぼ最高精度の解析結果が得られることが実験的に示され,分野最高峰の会議の一つであるEMNLP2011へ採録された.また,複数の構文解析結果を格納した空間を高速に作りだすために,線形時間で解析可能なシフトレデュース法のプログラム実装,計算時間は0(n^2)となるが,シフトレデュース法より高精度の解析が可能となるヘッドコーナー法の提案,開発を行った.このヘッドコーナー法に関する研究は分野最高峰の会議であるACL2012に採録されることが決定した.これらの構文解析に関する研究は日本語と英語のような言語間で翻訳を行う場合,重要な研究となるため,その実用的な価値は大きい.また,これらのプログラムコードについてはオープンソース化も検討している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初,検討していた機械翻訳方式とほぼ同様のアイディアがEMNLP2011で他の研究グループから提案されたため、新規性のある手法を再検討する必要が出たためである.
|
Strategy for Future Research Activity |
当該年度に開発した構文解析器を用いて,構文解析ベースの統計的機械翻訳システムを作成する.具体的には入力文を左から右にワンパスで解析しながら,翻訳結果を左から右に効率よく出力できる高速なシステムのアイディアとシステム開発を検討している.
|
Research Products
(1 results)