研究課題/領域番号 |
12410125
|
研究機関 | 大阪外国語大学 |
研究代表者 |
高階 美行 大阪外国語大学, 外国語学部, 教授 (70144540)
|
研究分担者 |
堀 一成 大阪外国語大学, 外国語学部, 助教授 (80270346)
石島 悌 大阪府立産業技術総合研究所, システム技術部, 研究職
松井 謙二 松下電気産業, 先端技術研究所, 研究職
山崎 直樹 大阪外国語大学, 外国語学部, 助教授 (30230402)
青野 繁治 大阪外国語大学, 外国語学部, 助教授 (00159302)
|
キーワード | 多言語処理 / 自動翻訳 / 自然音声データ / アジア系言語 / ユニコード / 多言語検索 |
研究概要 |
1.アジア系言語の音声データの構築と分析(以下、「研究実施計画」に記載順) 松下電器産業先端技術研究所と共同で、ATRによる『会話表現集データ』をベース(約500文)に、「多言語音声翻訳実験システム」(ヒンディー語、トルコ語、ドイツ語、タイ語)を構築した。これは、日本語自然音声による入力に対して、各言語の翻訳を文字ベースで出力する。下記3テーマとともに、中小企業総合事業団・民間経済諸団体等主催「大阪産官学連携フェア」(2001年1月29-30日、展示番号B-2)に出展した。出力に使用する音声データの作成が間に合わなかったが、入力・出力ともに自然音声の装置を作ることも可能である。 2.アジア系言語のテキストコーバスの入力 本研究チーム作成『海外旅行ダイアログ』を9言語の文字・音声データを作成中である。中国語では、このデータをXMLで記述し,JavaScriptとXSLでブラウザに表示する方法を開発し上記フェアで展示した(展示番号B-3)。 3.アジア系言語の既存電子化レキシコンの調査と新規構築 頻度調査に基づく日本語の語彙リストのアジア系言語による文字・音声データを構築中である。言語により進捗状況は異なる。これらの多言語データの検索システムを、大阪府立産業技術総合研究所の研究分担者と共同でFreeBSDとPostgrSQLで構築し、Unicodeによるデータをブラウザを介して利用する技術的問題を解決した(展示番号B-1)。この成果は、(社)情報処理学会で報告した。 4.Unicode体系におけるアジア系諸言語の配列原理の検討 各種の文字コードの現状を調査し、多言語データを利用する際の問題点を明らかにし、Webと論文で公開した。
|