• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2001 Fiscal Year Annual Research Report

多言語同時処理によるアジア系言語の音声・テキストデータベースの構築と応用

Research Project

Project/Area Number 12410125
Research InstitutionOsaka University of Foreign Studies

Principal Investigator

高階 美行  大阪外国語大学, 外国語学部, 教授 (70144540)

Co-Investigator(Kenkyū-buntansha) 堀 一成  大阪外国語大学, 外国語学部, 助教授 (80270346)
石島 悌  大阪府立産業技術総合研究所, システム技術部, 研究員 (研究職)
松井 謙二  松下電器産業, 先端技術研究所, グループコーディネーター(研究職)
山崎 直樹  大阪外国語大学, 外国語学部, 助教授 (30230402)
青野 繁治  大阪外国語大学, 外国語学部, 助教授 (00159302)
Keywords多言語処理 / 自動翻訳 / 自然音声データ / アジア系言語 / ユニコード / 多言語検索
Research Abstract

1.アジア系言語の音声データの構築と分析(以下、「研究実施計画」に記載順)
前年度は松下電器産業先端技術研究所と共同で、ATRによる『会話表現集データ』をべース(約500文)にヒンディー語、トルコ語、ドイツ語、タイ語の音声と文字データを提供し実験システムを構築したが、次項の作業との関連でダイアログの内容、翻訳のチェツクなど完成度を高めた。
2.アジア系言語のテキストコーパスの入力
本研究プロジェクト編『海外旅行ダイアログ』のアジア諸語データ(文字・音声)を作成した。中国語では昨年度、このデータをXMLで記述しJavaScriptとXSLでブラウザに表示する方法を既に開発したが、同様の機能を持つサーバサイドアプリケーションを作成し、ネットワーク上で使用することを可能とした。また、可能な範囲で、これらのプログラムとデータを収めたCD-ROMを作成した。
3.アジア系言語の既存電子化レキシコンの調査と新規構築
頻度調査に基づく日本語の語彙リストのアジア系言語による文字・音声データの作成に関しては、中国語の文字データ(5000語レベル)を完成し、音声データを収録した。タイ語など他の言語では、作業が進行中である。
4.Unicode体系におけるアジア系諸言語の配列原理の検討
Macintosh, Windowsなどの新OSの多言語対応状況を調査し、Webなどで公開した。これらの多言語データ(Unicode/UTF-8)の検索システムに関する技術的問題(FreeBSDとPostgrSQLによる)は前年度解決したが、今年度は携帯電話のimodeを利用したデータ活用のためのアプリケーションを開発した。

  • Research Products

    (3 results)

All Other

All Publications (3 results)

  • [Publications] 堀 一成: "PostgreSQLを用いた多言語文字・音声データベースの構築とアプリケーションの開発"(社)情報処理学会 第63回(平成13年後期)全国大会講演論文集(2). 2. 193-194 (2001)

  • [Publications] 山崎 直樹: "XMLを用いた中国語聴解教材の構想"大阪外大情報処理センターと情報処理教育の可能性. 95-102 (2002)

  • [Publications] 高階 美行: "Windows XPの多言語対応"大阪外大情報処理センターと情報処理教育の可能性(大阪外国語大学). 103-112 (2002)

URL: 

Published: 2003-04-03   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi