研究課題
基盤研究(B)
〔アジア系言語の音声データの構築と分析〕松下電器産業先端技術研究所と共同で、ヒンディー語、トルコ語、ドイツ語、タイ語の実験的自然言語翻訳システムを「大阪産官学連携フェア」に出展。入力は、日本語の自然音声である。〔アジア系言語のテキストコーパスの入力〕『海外旅行ダイアログ集』を日本語と英訳で作成し、アジア系言語に翻訳し音声データの収録を行った。中国語では、このデータをXMLとJavaScriptによりXSLのデータからブラウザに表示するアプリケーションや、同様の機能を持つサーバサイドアプリケーションを作成しネットワーク上での活用も可能とした。文字ベースではベトナム語、タイ語、ビルマ語、ヒンディー語が完成。音声データも、早期完成を目指している。〔アジア系言語の既存電子化レキシコンの調査と新規構築〕頻度順の日本語語彙リストに対応する中国語とタイ語の文字データを完成し、中国語では音声データを収録した。これをデータベースとして利用可能にする個別ファイル化は継続中である。データチェックの部内共同作業用に文字部分を冊子に印刷した。他の言語でも同様の作業が進行中で、引続き完成を目指している。〔Unicode体系におけるアジア系諸言語の配列原理の検討〕各OSの多言語対応状況を調査してWebなどで公開するとともに、多言語データ(Unicode/UTF-8)をネットワーク上でブラウザにより検索するシステムの技術的問題を(FreeBSDとPostgrSQL)した。また、携帯電話のimodeによる多言語データ活用のためのアプリケーションも開発した。(部内で共同利用するために、上記の各データとプログラムを収めたCD-ROMを作成した。)
すべて その他
すべて 文献書誌 (18件)