1998 Fiscal Year Annual Research Report
JCE-TC:日・中・英対訳コーパスの開発及びその応用
Project/Area Number |
09044179
|
Research Institution | Hiroshima City University |
Principal Investigator |
任 福継 広島市立大学, 情報科学部, 助教授 (20264947)
|
Co-Investigator(Kenkyū-buntansha) |
NIE Jianyun モントリオール大学, 情報研究学部, 助教授
REN Fuchun 華北電力大学, 工学部, 助教授
目良 和也 広島市立大学, 情報科学部, 助手 (50285425)
陳 春祥 広島県立大学, 情報教育センター, 助教授 (90264944)
北上 始 広島市立大学, 情報科学部, 教授 (50234240)
|
Keywords | コーパス / 日本語 / 中国語 / 英語 / 自然言語処理 / 機械翻訳 / 情報検索 / 知識獲得 |
Research Abstract |
本研究では, 日本語・中国語・英語の言語共同点と各言語の独自的特徴の検討を基に,日・中・英テキスト対訳コーパスを開発し,さらにそれを基にして自然言語処理への応用手法の研究・開発を行うことである。今年度ではコーパスの構築を行い,そして,コーパスの情報付け方法,対訳コーパスの文単位のアライメント,コーパスを利用した翻訳知識の獲得及び多言語情報検索などを行った.このような研究を通じ、以下のような成果が収めた。 (1) 従来の統計情報のみを利用するアライメント方式を用い,日中対訳コーパスを対象として実験を行ったが,欧米言語のような高い精度が得られなかった.この問題を検討し,我々は統計情報と特徴文字の性質の両方面を利用したアライメント方法を提案し,良い精度が得られた. (2) コーパスに対し単語の分割(セクメンテーション)が必要であるが,中国語などの連続に書く言語についていろいろな問題が残されている.我々は「敏感語」という新しい概念を提案し,これを用いコーパスの解析を行った.即ち,解析において,敏感語のみに着目し,非敏感語について曖昧性がないように処理する. (3) 大規模な対訳コーパスから翻訳知識の自動獲得が期待されているが,現実には,有用な翻訳知識を完全に自動でコーパスから取り出すのは容易でないと考える.我々はコーパスからの翻訳知識獲得手法を開発し,日中機械翻訳システムに応用し,その有効性を確認することが出来た. (4) 多言語情報検索では機械翻訳システムを利用するとどのような結果があるかについて,本研究ではいろいろな実験を行った.特に,日中英言語を対象として考察を行った.結果から,多言語情報抽出に対し従来の機械翻訳をそのまま利用するとあまり効果が上げられないが,単語レベルの解析結果を利用すると良い効果がある,ことが分かった. (5) 多エンジンによる機械翻訳手法を提案し,中英機械翻訳実験を行った.
|
Research Products
(13 results)
-
[Publications] Fuji Ren,Jianyun Nie: "The Concept of Sensitive Word in Chinese" Journal of Natural Language Processing. 6・1. 59-78 (1999)
-
[Publications] Fuji Ren,Lixin Fan: "A New Approach of Using Corpus in Machine Translation" Journal of Information. 1・2. 85-103 (1998)
-
[Publications] Jianyun Nie,Fuji Ren: "Chinese Information Retrieval:Using Characters or Words" Information Processing & Management.
-
[Publications] Fuji Ren,Youliang Jane: "Automatic Acquisition of Machine Translation Rule from Parallel Corpora" Communications of COLIPS. 8・2. 43-69 (1998)
-
[Publications] Oiang Zhou,Fuji Ren: "Acquisitions and Applications of Structure Preference Relations in Chinese" Natural Language Engineering.
-
[Publications] Fuji Ren,Zhensheng Luo: "A Hybrid Approach to the Real World Text Segmentation" Proc.of JCIS. 3. 243-249 (1998)
-
[Publications] Fuji Ren,Jianyun Nie,Lixin Fan: "Semi-Automatic Acquisition of Translation Knowledge from Examples" Proc.of ICCIP. 444-451 (1998)
-
[Publications] Mark Davis,Fuji Ren: "Automatic Japanes-Chinese Parallel Text Alignment" Proc.of ICCIP. 452-457 (1998)
-
[Publications] Fuji Ren: "The Next Generation Natural Language Processing" Information and Microelectronic Technology. 10-12 (1998)
-
[Publications] Fuji Ren,Jianyun Nie: "Automatic Word Segmentation of Chinese Texts Based on Sensitive Words Concept" Natural Language Processing. 98・1. 17-24 (1998)
-
[Publications] 任福継,定永靖史: "統計情報と文章構造特徴に基づく重要文の自動抽出" 情処研報. 98・2. 71-78 (1998)
-
[Publications] Fuji Ren,Jianping Zhang: "Word Segment in the Real World" Natural Language Processing. 98・2. 79-86 (1998)
-
[Publications] 任 福継: "T+文法の開発及びコーパスの収集" 広島市立大学研究報告. 99・8. 1-83 (1999)