2000 Fiscal Year Annual Research Report
多言語同時処理によるアジア系言語の音声・テキストデータベースの構築と応用
Project/Area Number |
12410125
|
Research Institution | Osaka University of Foreign Studies |
Principal Investigator |
高階 美行 大阪外国語大学, 外国語学部, 教授 (70144540)
|
Co-Investigator(Kenkyū-buntansha) |
堀 一成 大阪外国語大学, 外国語学部, 助教授 (80270346)
石島 悌 大阪府立産業技術総合研究所, システム技術部, 研究職
松井 謙二 松下電気産業, 先端技術研究所, 研究職
山崎 直樹 大阪外国語大学, 外国語学部, 助教授 (30230402)
青野 繁治 大阪外国語大学, 外国語学部, 助教授 (00159302)
|
Keywords | 多言語処理 / 自動翻訳 / 自然音声データ / アジア系言語 / ユニコード / 多言語検索 |
Research Abstract |
1.アジア系言語の音声データの構築と分析(以下、「研究実施計画」に記載順) 松下電器産業先端技術研究所と共同で、ATRによる『会話表現集データ』をベース(約500文)に、「多言語音声翻訳実験システム」(ヒンディー語、トルコ語、ドイツ語、タイ語)を構築した。これは、日本語自然音声による入力に対して、各言語の翻訳を文字ベースで出力する。下記3テーマとともに、中小企業総合事業団・民間経済諸団体等主催「大阪産官学連携フェア」(2001年1月29-30日、展示番号B-2)に出展した。出力に使用する音声データの作成が間に合わなかったが、入力・出力ともに自然音声の装置を作ることも可能である。 2.アジア系言語のテキストコーバスの入力 本研究チーム作成『海外旅行ダイアログ』を9言語の文字・音声データを作成中である。中国語では、このデータをXMLで記述し,JavaScriptとXSLでブラウザに表示する方法を開発し上記フェアで展示した(展示番号B-3)。 3.アジア系言語の既存電子化レキシコンの調査と新規構築 頻度調査に基づく日本語の語彙リストのアジア系言語による文字・音声データを構築中である。言語により進捗状況は異なる。これらの多言語データの検索システムを、大阪府立産業技術総合研究所の研究分担者と共同でFreeBSDとPostgrSQLで構築し、Unicodeによるデータをブラウザを介して利用する技術的問題を解決した(展示番号B-1)。この成果は、(社)情報処理学会で報告した。 4.Unicode体系におけるアジア系諸言語の配列原理の検討 各種の文字コードの現状を調査し、多言語データを利用する際の問題点を明らかにし、Webと論文で公開した。
|
-
[Publications] 高階美行: "コンピュータにおける文字コードのはなし"中東イスラム・アフリカ文化の諸相と言語研究(大阪外国語大学). 355-373 (2001)
-
[Publications] 高階美行: "多国語HTML(UTF-8)の作り方"大阪外国語大学におけるネットワークの活用とセキュリティ(大阪外国語大学). 36-48 (2001)
-
[Publications] 青野繁治: "日中・中日自動翻訳ソフト『J・北京』の実力"大阪外国語大学におけるネットワークの活用とセキュリティ(大阪外国語大学). 1-16 (2001)
-
[Publications] 堀一成: "PostgreSQLによる多言語単語データベースの構築"(社)情報処理学会第62回(平成13年前期)全国大会講演論文集(2). 2. 297-298 (2001)