研究課題/領域番号 |
63633514
|
研究種目 |
重点領域研究
|
配分区分 | 補助金 |
研究機関 | 東京大学 |
研究代表者 |
有本 卓 東京大学, 工学部, 教授 (00029399)
|
研究分担者 |
鈴木 寿 大阪大学, 基礎工学部, 助手 (10206518)
|
研究期間 (年度) |
1988
|
研究課題ステータス |
完了 (1988年度)
|
配分額 *注記 |
1,600千円 (直接経費: 1,600千円)
1988年度: 1,600千円 (直接経費: 1,600千円)
|
キーワード | 音声メッセージ認知システム / 擬似音節 / 連想データベース自己組織化 / 言語学的表記 / 学習 |
研究概要 |
入力音声信号の短時間パワーの極小点を分割タイミングとする擬似音節の概念を導入し、新たに音声メッセージ認知システムを開発した。その第一段は、音声信号を擬似音節へ分解する。第二段は、擬似音節に対応する言語学的表記(音節の組合せ)を推定する。第二段では連想データベースの自己組織化に基づく学習アルゴリズムが基本となり、擬似音節と言語学的表記の対応関係を柔軟に学習させる。この手法に基づき、AD/AD信号変換ボードと20MBハードディスクを付設したマイクロコンピュータPC-9800/V上でC言語によるプログラム開発を行い、音声メッセージ認知システムを実現した。実験の結果、日本語の代表的な約300個の擬似音節を約75%の正答率で認知できた。日本語の統計的構造を利用すると、音節の正答率がこの程度なら、文章をほとんど正しく復元できることが知られており、開発したシステムは優れた認知性能をもつことがわかる。また、本実験から、音声信号と言語学的表記とは一対一対応せず、従来の音声認識システムの枠組みでは、音声メッセージの認知が十分に行えないことがわかった。一方、開発したシステムは、従来方式の音声認識システムの性能を、認識結果の正答率の点で凌駕することが確認できた。さらに、開発システムでは、語いのサイズに依存する学習の内的評価規範の下で、日本語・英語を問わず、基本単位となる音声信号を自動的に抽出・分類することができる。現在、この特長に関して検討を加え、評価実験を行っている。また、音声メッセージ認知システムとの開発と平行して、同様な方法論に基づく画像メッセージの認知システムを開発中である。
|