2003 Fiscal Year Annual Research Report
多言語同時処理によるアジア系言語の自然言語翻訳に関する基礎研究
Project/Area Number |
14310220
|
Research Institution | Osaka University of Foreign Studies |
Principal Investigator |
高階 美行 大阪外国語大学, 外国語学部, 教授 (70144540)
|
Co-Investigator(Kenkyū-buntansha) |
堀 一成 大阪外国語大学, 外国語学部, 助教授 (80270346)
石島 悌 大阪府立産業技術総合研究所, システム技術部, 研究職 (80359398)
清野 正樹 松下電器産業, 先端技術研究所, 研究職
山崎 直樹 大阪外国語大学, 外国語学部, 助教授 (30230402)
青野 繁治 大阪外国語大学, 外国語学部, 教授 (00159302)
|
Keywords | 多言語処理 / 音声翻訳 / 自然音声データ / アジア系言語 / ユニコード / 電子化レキシコン |
Research Abstract |
基礎語彙の文字・音声データの集積 前年度に続き、海外旅行ダイアログと基本語彙(日本語、広東語、朝鮮語、トルコ語、ヒンディー語)の文字・音声データの集積を行った。 電子化レキシコンの構造化と試行的構築 電子化レキシコンを構築するにあたり、XMLを用いて行うためには、詳細なデータ設計が必要である。本年度は独立行政法人産業技術総合研究所の橋田浩一氏が提唱するGDA(大域文書修飾)に基づいた共通文書タグ付けを試み、その問題点と改良点について研究し、成果を研究会で発表した。 モバイル端末での利用のための技術的検討 Linux搭載HPCにおけるシステムは、特に表示が不完全であったタイ語の表示の改良を行い、その成果を研究会で発表した。また言語処理学会で発表の予定である。 既存の多言語会話データの完成度向上 海外旅行ダイアログの不備な点を改良し、Ver.2を作成した。これによるダイアログ・テキスト改訂は中国語とアラビア語で行い、アラビア語は修正用音声データも作成した。 研究成果の発表について 1)大阪府主催の産学官連携展示会である「テクノパワー2003in OSAKA」において上記の研究成果を発表展示した。2)2003年12月6日開催の漢字文献情報処理研究会において、データの構造化研究として山崎直樹氏が「XMLで既存のテクストを構造化する-中国古典詩での試み」を発表した。3)2004年3月開催の言語処理学会において本年度の研究成果をまとめて発表する予定である。4)学内外をあわせ3回の研究会を開催し、研究成果について発表し討論を行った。
|
Research Products
(2 results)
-
[Publications] 石島 悌, 林 治尚: "Zaurus with Linux [04]"ASCII. Vol.18No.9. 147-155 (2003)
-
[Publications] 堀 一成: "大阪外国語大学の言語資源を用いた言語e-learningの構想"言語処理学会第10回年次大会(NLP2004) 講演論文集2004年3月刊行予定. (2004)