研究課題/領域番号 |
07808037
|
研究種目 |
一般研究(C)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 北海道大学 |
研究代表者 |
宮永 喜一 北海道大学, 工学部, 助教授 (20166185)
|
研究期間 (年度) |
1995
|
研究課題ステータス |
完了 (1995年度)
|
配分額 *注記 |
2,000千円 (直接経費: 2,000千円)
1995年度: 2,000千円 (直接経費: 2,000千円)
|
キーワード | 非定常スペクトル解析 / 時変音声分析 / 適応的係数推定 / 自己組織化ネットワーク / 音声認識 / ニューラルネットワーク / セルラ-ニューラルネット / 並列処理 |
研究概要 |
本研究では時変な特徴の認識を可能とする自己組織化ネットワークの設計を目的として、次の項目について検討し、成果を得た。 1.本システムは、性質の異なる2つのネットワークにより構成した。これは今までの実験経過等により1つのネットワークによってすべてのデータに対する認識を実現する事は実際には無理であり、入力データの特徴をある程度大分類し、その分類に従ってネットワークの構造を変化させる事がもっとも良いと判断したためである。 2.学習・認識のネットワークは、自己組織化を行う第1層と、強制学習に基ずく第2層により構成した。特に認識には自己組織化層が重要な役割を持ち、そこでは最初の段階で入力された特徴量をある距離に従って、自動的にクラスタリングしている。ここでの特徴データは時間的に変動するケプストラムや波形のエネルギー・位相等を考えた。さらに時間変化の情報として、入力情報の速度や加速度も特徴データとして考慮した。これら性質の異なる特徴を、分割型クラスタリングネットワークによって自己組織化し、クラスタリングした。このクラスタリングは時間の変動に追従する必要があるし、学習データに対して誤認識を生じさせない程度にクラスタの生成・融合・消滅を行ない、その結果として未知データに対する汎化能力を向上させる必要があるので、いくつかの時間重みを導入し、適切に動作することを確認した。 3.上記のシステムはかなり計算複雑度が高いため、導入された設備を利用して連続音声認識と環境雑音認識実験を行なった。音声の認識には、アルゴリズムに対する有効性検討に対して多くの実験が必要である。特に不特定話者に対する認識はデータの分析や量も重要な問題であり、本研究では各研究機関で一般的に利用されているデータベースの中から幾つかの男性・女性音声を用いて認識実験を行なった。
|