研究課題/領域番号 |
12410125
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
その他外国語・外国文学
|
研究機関 | 大阪外国語大学 |
研究代表者 |
高階 美行 大阪外国語大学, 外国語学部, 教授 (70144540)
|
研究分担者 |
堀 一成 大阪外国語大学, 外国語学部, 助教授 (80270346)
石島 悌 大阪府立産業技術総合研究所, システム技術部, 研究職
松井 謙二 松下電器産業, 先端技術研究所, 研究職
山崎 直樹 大阪外国語大学, 外国語学部, 助教授 (30230402)
青野 繁治 大阪外国語大学, 外国語学部, 助教授 (00159302)
|
研究期間 (年度) |
2000 – 2001
|
研究課題ステータス |
完了 (2001年度)
|
配分額 *注記 |
13,900千円 (直接経費: 13,900千円)
2001年度: 4,700千円 (直接経費: 4,700千円)
2000年度: 9,200千円 (直接経費: 9,200千円)
|
キーワード | 多言語処理 / 自動翻訳 / 自然音声データ / アジア系言語 / ユニコード / 多言語検索 |
研究概要 |
〔アジア系言語の音声データの構築と分析〕松下電器産業先端技術研究所と共同で、ヒンディー語、トルコ語、ドイツ語、タイ語の実験的自然言語翻訳システムを「大阪産官学連携フェア」に出展。入力は、日本語の自然音声である。 〔アジア系言語のテキストコーパスの入力〕『海外旅行ダイアログ集』を日本語と英訳で作成し、アジア系言語に翻訳し音声データの収録を行った。中国語では、このデータをXMLとJavaScriptによりXSLのデータからブラウザに表示するアプリケーションや、同様の機能を持つサーバサイドアプリケーションを作成しネットワーク上での活用も可能とした。文字ベースではベトナム語、タイ語、ビルマ語、ヒンディー語が完成。音声データも、早期完成を目指している。 〔アジア系言語の既存電子化レキシコンの調査と新規構築〕頻度順の日本語語彙リストに対応する中国語とタイ語の文字データを完成し、中国語では音声データを収録した。これをデータベースとして利用可能にする個別ファイル化は継続中である。データチェックの部内共同作業用に文字部分を冊子に印刷した。他の言語でも同様の作業が進行中で、引続き完成を目指している。 〔Unicode体系におけるアジア系諸言語の配列原理の検討〕各OSの多言語対応状況を調査してWebなどで公開するとともに、多言語データ(Unicode/UTF-8)をネットワーク上でブラウザにより検索するシステムの技術的問題を(FreeBSDとPostgrSQL)した。また、携帯電話のimodeによる多言語データ活用のためのアプリケーションも開発した。(部内で共同利用するために、上記の各データとプログラムを収めたCD-ROMを作成した。)
|