• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2001 年度 実績報告書

多言語同時処理によるアジア系言語の音声・テキストデータベースの構築と応用

研究課題

研究課題/領域番号 12410125
研究機関大阪外国語大学

研究代表者

高階 美行  大阪外国語大学, 外国語学部, 教授 (70144540)

研究分担者 堀 一成  大阪外国語大学, 外国語学部, 助教授 (80270346)
石島 悌  大阪府立産業技術総合研究所, システム技術部, 研究員 (研究職)
松井 謙二  松下電器産業, 先端技術研究所, グループコーディネーター(研究職)
山崎 直樹  大阪外国語大学, 外国語学部, 助教授 (30230402)
青野 繁治  大阪外国語大学, 外国語学部, 助教授 (00159302)
キーワード多言語処理 / 自動翻訳 / 自然音声データ / アジア系言語 / ユニコード / 多言語検索
研究概要

1.アジア系言語の音声データの構築と分析(以下、「研究実施計画」に記載順)
前年度は松下電器産業先端技術研究所と共同で、ATRによる『会話表現集データ』をべース(約500文)にヒンディー語、トルコ語、ドイツ語、タイ語の音声と文字データを提供し実験システムを構築したが、次項の作業との関連でダイアログの内容、翻訳のチェツクなど完成度を高めた。
2.アジア系言語のテキストコーパスの入力
本研究プロジェクト編『海外旅行ダイアログ』のアジア諸語データ(文字・音声)を作成した。中国語では昨年度、このデータをXMLで記述しJavaScriptとXSLでブラウザに表示する方法を既に開発したが、同様の機能を持つサーバサイドアプリケーションを作成し、ネットワーク上で使用することを可能とした。また、可能な範囲で、これらのプログラムとデータを収めたCD-ROMを作成した。
3.アジア系言語の既存電子化レキシコンの調査と新規構築
頻度調査に基づく日本語の語彙リストのアジア系言語による文字・音声データの作成に関しては、中国語の文字データ(5000語レベル)を完成し、音声データを収録した。タイ語など他の言語では、作業が進行中である。
4.Unicode体系におけるアジア系諸言語の配列原理の検討
Macintosh, Windowsなどの新OSの多言語対応状況を調査し、Webなどで公開した。これらの多言語データ(Unicode/UTF-8)の検索システムに関する技術的問題(FreeBSDとPostgrSQLによる)は前年度解決したが、今年度は携帯電話のimodeを利用したデータ活用のためのアプリケーションを開発した。

  • 研究成果

    (3件)

すべて その他

すべて 文献書誌 (3件)

  • [文献書誌] 堀 一成: "PostgreSQLを用いた多言語文字・音声データベースの構築とアプリケーションの開発"(社)情報処理学会 第63回(平成13年後期)全国大会講演論文集(2). 2. 193-194 (2001)

  • [文献書誌] 山崎 直樹: "XMLを用いた中国語聴解教材の構想"大阪外大情報処理センターと情報処理教育の可能性. 95-102 (2002)

  • [文献書誌] 高階 美行: "Windows XPの多言語対応"大阪外大情報処理センターと情報処理教育の可能性(大阪外国語大学). 103-112 (2002)

URL: 

公開日: 2003-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi