Project/Area Number |
05808031
|
Research Category |
Grant-in-Aid for General Scientific Research (C)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Hokkaido University |
Principal Investigator |
宮永 喜一 北海道大学, 工学部, 助教授 (20166185)
|
Project Period (FY) |
1993
|
Project Status |
Completed (Fiscal Year 1993)
|
Budget Amount *help |
¥1,700,000 (Direct Cost: ¥1,700,000)
Fiscal Year 1993: ¥1,700,000 (Direct Cost: ¥1,700,000)
|
Keywords | 非定常スペクトル解析 / 時変音声分析 / 適応的係数推定 / 自己組織化ネットワーク / ニューラルネットワーク / 音声認識 / セルラーニューラルネット / 並列処理 |
Research Abstract |
本研究は、連続音声の適応的分析・認識を目的とした自己組織化情報処理システムの基本アルゴリズム設計と音声入出力を持つUnixシステム上での実現を目指し、基本アルゴリズムでは、新しい時変スペクトル推定の手法の開発を行ない、従来の方法との比較によりその有効性を確認した。また認識部分ではニューラルネットワークで知られている、自己組織化ネットワークを用い、各ノードに高効率のアルゴリズムを導入し、クラスタリング性能や認識性能の向上を考えた。さらに当該年度で、それらの手法を統合し、高度なヒューマンインターフェースをもつソフトウエアシステムとして開発を行なった。本システムの特徴は、従来の方法では難しいとされていた認識の適応性と汎化性を合わせ持つ情報処理システムとして、自己組織化能力を有する適応メディア処理システムを実現していることである。適応性は、音声信号の特徴を獲得するアルゴリズム中に実現し、時変な特徴が精度良く求められることを示した。ここでは、特に時変な特徴とは何か、その表現はどのようにするのが良いか等の、基本的な考え方についても考察し、その成果を幾つかの論文にまとめ発表した。音声の時変分析を行なった後処理として、認識手法の開発も行なった。これは時変な特徴にもっとも適した規範テンプレートを自己組織的に実現する認識システムであり、クラスタリング部では、各規範テンプレート間に適切な位相(距離)を持たせ、汎化能力を向上させた。但し、実験では複数の男性話者に対する母音の認識にとどまっており、子音の認識については現在実験遂行中である。認識システムでの特徴は、時間変動を伴う特徴もクラスタリング可能にするため多層の自己組織化モデルを考えているため、音声が徐々に変化する部分における特徴の認識が効率良く行なわれることが分かったが、そのシステムの特徴をよりよく応用できる認識即ち破裂子音等の分析・認識については現在実験中である。
|