研究課題/領域番号 |
09044179
|
研究機関 | 広島市立大学 |
研究代表者 |
任 福継 広島市立大学, 情報科学部, 助教授 (20264947)
|
研究分担者 |
ZHENSHENG Lu 清華大学, 中文学部, 教授
YOULIANG Jia 大連理工大学, 計算機学部, 教授
JIANYUN Nie モントリオール大学, 情報研究学部, 助教授
MARK Davis ニューメキシコ州立大学, CRL, 研究員
北上 始 広島市立大学, 情報科学部, 教授 (50234240)
|
キーワード | コーパス / 日本語 / 中国語 / 英語 / 機械翻訳 / 知識獲得 / 統計情報 / 辞書 |
研究概要 |
本研究では,日本語・中国語・英語の言語共同点と各言語の独自的特徴の検討を基に,日・中・英テキスト対訳コーパスを開発し,さらにそれを基にして自然言語処理特に多言語機械翻訳への応用手法の研究・開発を行うことである。今年度では以下の調査研究を行った。 (1)中国・シンがポール・アメリカのコーパス研究現状の調査および意見交換を行い,JCE-TCプロジェクト研究開発方法の具体化を行った。 (2)日中英3国語が使える研究環境を作り,CJE-TCの対訳データの入力規定と開発ツールを作成した。 (3)タグつきコーパス及び分析ずみコーパス作成におけるコンピュータサポート技術の検討を行った。 (4)日中対訳データから文の対応づけの方法及び数学モデルを研究した。 (5)データ入力用のツールおよびコーパスから知識獲得支援ツールを作成した。 このような調査研究を通じ、以下のような成果が収めた。 (1)日本語文の漢字と中国語文の漢字の特徴を用い、日本語と中国語のテキストの文対応手法を提案した。これは単に統計的な手法より正解率の高いことが実験から分かった。 (2)中国語コーパスの解析を行う際には、形態素解析が必要であるが、いまでも、高精度の中国語形態素解析方法が存在しない。中国でもシンガポールでも幾つかの研究機関がこの問題に挑戦しているが、我々は統計情報と辞書情報の併用により、従来の手法よりよい結果が得られていた。 (3)大規模な対訳コーパスから各種各様な翻訳知識の自動獲得が期待されているが、現実には、有用な翻訳知識を完全に自動でコーパスから取り出すのは容易でないと考える。我々は、人間とコンピュータの各自の利点を活かす観点を用い、対訳コーパスを別の視点から利用する方法を考えた。これは、完全に自動的に対訳コーパスから翻訳知識を獲得することができない現実から、人間の介入により対訳コーパスを有効的に利用するアプローチである。具体的には、現段階困難であり、かつ機械翻訳システムに高く要求される文節の対応と制約条件を人間に任せ、その他をコンピュータによって自動的に獲得する。 今後、引き続きコーパス規模を拡大し、機械翻訳への応用手法を研究する予定である。
|