2009 Fiscal Year Annual Research Report
多言語対訳コーパスを用いた言語間距離の計算とその応用
Project/Area Number |
19500137
|
Research Institution | National Institute of Information and Communications Technology |
Principal Investigator |
隅田 英一郎 National Institute of Information and Communications Technology, 知識創成コミュニケーション研究センター・言語翻訳グループ, グループリーダー (90395020)
|
Keywords | 自然言語処理 |
Research Abstract |
(A)距離計算方式の提案と実装 構文利用の翻訳方式の提案・実装、双方向翻訳方式の提案と実装、対訳に基づいて学習する形態素解析手法の提案と実装、換言による翻訳方式の提案と実装、動的モデル統合法の提案と実装、双方向翻字の提案と実装など、翻訳の基本方式の改良を行い、多数の言語対によって、翻訳手法の汎用性を確認した。これに基づいて昨年度提案した言語間距離を計算する基本方式を拡張し、多数の言語対について言語学的な類型論と矛盾しない計算結果を得た。 (B)学習時間と現在まで考案した言語間距離(翻訳困難度)の関係 米国の調査「英語話者が外国語の集中コースによって上級レベルに到達するまでの学習時間」は、(1)フランス語、ドイツ語、スペイン語は20週、(2)アラビア語、中国語、日本語は44週となっている。英語と(1)の言語の言語間距離(翻訳困難度)は、英語と(2)の言語の言語間距離(翻訳困難度)より小さいので学習時間とおおむね相関する。ただ、アラビア語、中国語、日本語は同じ(2)の学習時間であるが、言語間距離に関して、アラビア語、中国語、日本語の順に距離が大きく異なったので、学習時間との関係を説明するためには、さらに、言語間距離の計算手法の改善を要することがわかった。 (C)多言語の翻訳システムの作成 21言語(英、独、デンマーク、オランダ、仏、イタリア、スペイン、ポルトガル、ブラジル、日本、北京、韓国、ロシア、アラビア、ヒンディ、インドネシア、マレー、タイ、タガログ、ベトナム、台湾華語)の翻訳システムを構築し、ネットワーク経由でiPhoneで利用するシステムを構築した。
|
Research Products
(13 results)