2001 Fiscal Year Annual Research Report
多言語同時処理によるアジア系言語の音声・テキストデータベースの構築と応用
Project/Area Number |
12410125
|
Research Institution | Osaka University of Foreign Studies |
Principal Investigator |
高階 美行 大阪外国語大学, 外国語学部, 教授 (70144540)
|
Co-Investigator(Kenkyū-buntansha) |
堀 一成 大阪外国語大学, 外国語学部, 助教授 (80270346)
石島 悌 大阪府立産業技術総合研究所, システム技術部, 研究員 (研究職)
松井 謙二 松下電器産業, 先端技術研究所, グループコーディネーター(研究職)
山崎 直樹 大阪外国語大学, 外国語学部, 助教授 (30230402)
青野 繁治 大阪外国語大学, 外国語学部, 助教授 (00159302)
|
Keywords | 多言語処理 / 自動翻訳 / 自然音声データ / アジア系言語 / ユニコード / 多言語検索 |
Research Abstract |
1.アジア系言語の音声データの構築と分析(以下、「研究実施計画」に記載順) 前年度は松下電器産業先端技術研究所と共同で、ATRによる『会話表現集データ』をべース(約500文)にヒンディー語、トルコ語、ドイツ語、タイ語の音声と文字データを提供し実験システムを構築したが、次項の作業との関連でダイアログの内容、翻訳のチェツクなど完成度を高めた。 2.アジア系言語のテキストコーパスの入力 本研究プロジェクト編『海外旅行ダイアログ』のアジア諸語データ(文字・音声)を作成した。中国語では昨年度、このデータをXMLで記述しJavaScriptとXSLでブラウザに表示する方法を既に開発したが、同様の機能を持つサーバサイドアプリケーションを作成し、ネットワーク上で使用することを可能とした。また、可能な範囲で、これらのプログラムとデータを収めたCD-ROMを作成した。 3.アジア系言語の既存電子化レキシコンの調査と新規構築 頻度調査に基づく日本語の語彙リストのアジア系言語による文字・音声データの作成に関しては、中国語の文字データ(5000語レベル)を完成し、音声データを収録した。タイ語など他の言語では、作業が進行中である。 4.Unicode体系におけるアジア系諸言語の配列原理の検討 Macintosh, Windowsなどの新OSの多言語対応状況を調査し、Webなどで公開した。これらの多言語データ(Unicode/UTF-8)の検索システムに関する技術的問題(FreeBSDとPostgrSQLによる)は前年度解決したが、今年度は携帯電話のimodeを利用したデータ活用のためのアプリケーションを開発した。
|
Research Products
(3 results)
-
[Publications] 堀 一成: "PostgreSQLを用いた多言語文字・音声データベースの構築とアプリケーションの開発"(社)情報処理学会 第63回(平成13年後期)全国大会講演論文集(2). 2. 193-194 (2001)
-
[Publications] 山崎 直樹: "XMLを用いた中国語聴解教材の構想"大阪外大情報処理センターと情報処理教育の可能性. 95-102 (2002)
-
[Publications] 高階 美行: "Windows XPの多言語対応"大阪外大情報処理センターと情報処理教育の可能性(大阪外国語大学). 103-112 (2002)