• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2000 年度 実績報告書

多言語同時処理によるアジア系言語の音声・テキストデータベースの構築と応用

研究課題

研究課題/領域番号 12410125
研究機関大阪外国語大学

研究代表者

高階 美行  大阪外国語大学, 外国語学部, 教授 (70144540)

研究分担者 堀 一成  大阪外国語大学, 外国語学部, 助教授 (80270346)
石島 悌  大阪府立産業技術総合研究所, システム技術部, 研究職
松井 謙二  松下電気産業, 先端技術研究所, 研究職
山崎 直樹  大阪外国語大学, 外国語学部, 助教授 (30230402)
青野 繁治  大阪外国語大学, 外国語学部, 助教授 (00159302)
キーワード多言語処理 / 自動翻訳 / 自然音声データ / アジア系言語 / ユニコード / 多言語検索
研究概要

1.アジア系言語の音声データの構築と分析(以下、「研究実施計画」に記載順)
松下電器産業先端技術研究所と共同で、ATRによる『会話表現集データ』をベース(約500文)に、「多言語音声翻訳実験システム」(ヒンディー語、トルコ語、ドイツ語、タイ語)を構築した。これは、日本語自然音声による入力に対して、各言語の翻訳を文字ベースで出力する。下記3テーマとともに、中小企業総合事業団・民間経済諸団体等主催「大阪産官学連携フェア」(2001年1月29-30日、展示番号B-2)に出展した。出力に使用する音声データの作成が間に合わなかったが、入力・出力ともに自然音声の装置を作ることも可能である。
2.アジア系言語のテキストコーバスの入力
本研究チーム作成『海外旅行ダイアログ』を9言語の文字・音声データを作成中である。中国語では、このデータをXMLで記述し,JavaScriptとXSLでブラウザに表示する方法を開発し上記フェアで展示した(展示番号B-3)。
3.アジア系言語の既存電子化レキシコンの調査と新規構築
頻度調査に基づく日本語の語彙リストのアジア系言語による文字・音声データを構築中である。言語により進捗状況は異なる。これらの多言語データの検索システムを、大阪府立産業技術総合研究所の研究分担者と共同でFreeBSDとPostgrSQLで構築し、Unicodeによるデータをブラウザを介して利用する技術的問題を解決した(展示番号B-1)。この成果は、(社)情報処理学会で報告した。
4.Unicode体系におけるアジア系諸言語の配列原理の検討
各種の文字コードの現状を調査し、多言語データを利用する際の問題点を明らかにし、Webと論文で公開した。

  • 研究成果

    (4件)

すべて その他

すべて 文献書誌 (4件)

  • [文献書誌] 高階美行: "コンピュータにおける文字コードのはなし"中東イスラム・アフリカ文化の諸相と言語研究(大阪外国語大学). 355-373 (2001)

  • [文献書誌] 高階美行: "多国語HTML(UTF-8)の作り方"大阪外国語大学におけるネットワークの活用とセキュリティ(大阪外国語大学). 36-48 (2001)

  • [文献書誌] 青野繁治: "日中・中日自動翻訳ソフト『J・北京』の実力"大阪外国語大学におけるネットワークの活用とセキュリティ(大阪外国語大学). 1-16 (2001)

  • [文献書誌] 堀一成: "PostgreSQLによる多言語単語データベースの構築"(社)情報処理学会第62回(平成13年前期)全国大会講演論文集(2). 2. 297-298 (2001)

URL: 

公開日: 2002-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi