Project/Area Number |
63633514
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Research Institution | The University of Tokyo |
Principal Investigator |
有本 卓 東京大学, 工学部, 教授 (00029399)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 寿 大阪大学, 基礎工学部, 助手 (10206518)
|
Project Period (FY) |
1988
|
Project Status |
Completed (Fiscal Year 1988)
|
Budget Amount *help |
¥1,600,000 (Direct Cost: ¥1,600,000)
Fiscal Year 1988: ¥1,600,000 (Direct Cost: ¥1,600,000)
|
Keywords | 音声メッセージ認知システム / 擬似音節 / 連想データベース自己組織化 / 言語学的表記 / 学習 |
Research Abstract |
入力音声信号の短時間パワーの極小点を分割タイミングとする擬似音節の概念を導入し、新たに音声メッセージ認知システムを開発した。その第一段は、音声信号を擬似音節へ分解する。第二段は、擬似音節に対応する言語学的表記(音節の組合せ)を推定する。第二段では連想データベースの自己組織化に基づく学習アルゴリズムが基本となり、擬似音節と言語学的表記の対応関係を柔軟に学習させる。この手法に基づき、AD/AD信号変換ボードと20MBハードディスクを付設したマイクロコンピュータPC-9800/V上でC言語によるプログラム開発を行い、音声メッセージ認知システムを実現した。実験の結果、日本語の代表的な約300個の擬似音節を約75%の正答率で認知できた。日本語の統計的構造を利用すると、音節の正答率がこの程度なら、文章をほとんど正しく復元できることが知られており、開発したシステムは優れた認知性能をもつことがわかる。また、本実験から、音声信号と言語学的表記とは一対一対応せず、従来の音声認識システムの枠組みでは、音声メッセージの認知が十分に行えないことがわかった。一方、開発したシステムは、従来方式の音声認識システムの性能を、認識結果の正答率の点で凌駕することが確認できた。さらに、開発システムでは、語いのサイズに依存する学習の内的評価規範の下で、日本語・英語を問わず、基本単位となる音声信号を自動的に抽出・分類することができる。現在、この特長に関して検討を加え、評価実験を行っている。また、音声メッセージ認知システムとの開発と平行して、同様な方法論に基づく画像メッセージの認知システムを開発中である。
|