2009 Fiscal Year Annual Research Report
主辞駆動句構造文法のための統計同期文法による機械翻訳
Project/Area Number |
19680007
|
Research Institution | Ehime University |
Principal Investigator |
二宮 崇 愛媛大学, 大学院・理工学研究科, 准教授 (20444094)
|
Keywords | 自然言語処理 / 機械翻訳 / HPSG / 構文解析 / オンライン学習 / 読解支援 |
Research Abstract |
平成21年度および平成22年度(繰越)は、研究計画に沿って、対訳テキストの開発、機械翻訳のための基盤システムの開発、主辞駆動句構造文法(HPSG)のための同期文法の開発を行った。 [対訳テキストの開発]本課題は、英字新聞ウォール・ストリート・ジャーナルに付与されたHPSG構文構造から自動的に同期文法を得ることを目標としているが、そのためにはこの新聞の英日対訳テキストが必要となる。本課題では、ウォール・ストリート・ジャーナルの英日対訳を約1万1千文開発した。本課題で翻訳したウォール・ストリート・ジャーナルのテキストは、自然言語処理で最もよく用いられるデータであり、この対訳テキストは自然言語処理全般で有用なデータとして用いられることが期待される。 [基盤システム]演繹操作によるHPSG構文構造データの開発を目標とし、その開発を容易にするライブラリを開発した。また、統計的モデルの学習のために、オンライン学習の研究および開発を行った。本研究で開発した手法はオンライン学習における精度面の問題を克服し、機械学習において最も性能が高いと考えられているSVMに匹敵する精度を達成した。また、機械翻訳に関連し対訳表示による英文読解支援の研究も行った。 [HPSG同期文法の開発]HPSG同期文法を開発するために、本課題において開発した対訳テキストと、GIZA++と呼ばれる単語対応付けソフトウェアを用いて、単語レベルで対応付けされたウォール・ストリート・ジャーナルの対訳テキストを開発した。この対訳テキストにはHPSG構文構造が付与されているため、これらのHPSG構文構造と単語対応に対しコーパスベースの帰納的文法開発手法を適用することにより、英語文法と日本語文法が対応付けされたHPSG同期文法を獲得することに成功した。
|
-
-
-
-
-
-
-
-
[Remarks] 学会発表の論文に対し次の2件の受賞があった。
-
[Remarks] ・NLP若手の会 第5回シンポジウム 奨励賞,NLP若手の会,2010年9月。
-
[Remarks] ・情報処理学会 HCI研究会 2010年度 学生奨励賞,情報処理学会HCI研究会,2011年3月。