2010 Fiscal Year Annual Research Report
Project/Area Number |
22650047
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 名古屋大学, 大学院・工学研究科, 教授 (30205918)
|
Keywords | 多言語処理 / 機械翻訳 / 選択型翻訳 / 言語横断検索 / 情報検索支援 / ウィキペディア |
Research Abstract |
本研究では、選択型翻訳と名付ける、複合語の新しい翻訳方式を確立し、これを利用して、有限の索引リストを持つ情報源に対する効率的な言語横断検索法を実現することに取り組んでいる。本年度は、以下のことを行った。 (1) 複合語を対象とした選択型翻訳のアルゴリズムを定め、これを実行するプログラムを作成した。このアルゴリズムは、対訳辞書を利用した訳語候補生成と索引リストとの照合を、動的計画法を用いて漸進的に行うアルゴリズムである。索引リストとの最適照合の部分は今後の改良が必要であるが、英語ウィキペィアの全見出し語を索引リストとした日英翻訳の場合でも、実用的な速度で実行できる見通しを得た。 (2) 先に作成済みの選択型トランスリタレーションシステムを、上記の選択型翻訳に、拡張カタカナ語辞書として組み込む方法を定め、プログラムとして実現した。これにより、本研究で作成すべきシステムの骨格がほぼ定まった。このプログラムをベースとしたデモシステムを作成し、英語ウィキペディアの記事(見出し語)を日本語で引くことができることを確認した。 (3) 科学技術用語辞典(書籍)から日英対訳を拾い、暫定的なテストセットを作成した。適切なテストセットの作成は、予想より難しく、今後、再検討が必要であることがわかった。 (4) 上記のテストセットを用いて、システムの動作を確認する実験を行った.この結果、選択型翻訳で使用する対訳辞書の網羅性に問題があることが判明した。 本年度でシステムの骨格はほぼ定まったので、次年度以降は、システムの実験的評価と問題点の解決に取り組む予定である。
|
Research Products
(1 results)