1995 Fiscal Year Annual Research Report
自己組織化ネットワークによる時変な特徴の認識に関する研究
Project/Area Number |
07808037
|
Research Institution | Hokkaido University |
Principal Investigator |
宮永 喜一 北海道大学, 工学部, 助教授 (20166185)
|
Keywords | 非定常スペクトル解析 / 時変音声分析 / 適応的係数推定 / 自己組織化ネットワーク / 音声認識 / ニューラルネットワーク / セルラ-ニューラルネット / 並列処理 |
Research Abstract |
本研究では時変な特徴の認識を可能とする自己組織化ネットワークの設計を目的として、次の項目について検討し、成果を得た。 1.本システムは、性質の異なる2つのネットワークにより構成した。これは今までの実験経過等により1つのネットワークによってすべてのデータに対する認識を実現する事は実際には無理であり、入力データの特徴をある程度大分類し、その分類に従ってネットワークの構造を変化させる事がもっとも良いと判断したためである。 2.学習・認識のネットワークは、自己組織化を行う第1層と、強制学習に基ずく第2層により構成した。特に認識には自己組織化層が重要な役割を持ち、そこでは最初の段階で入力された特徴量をある距離に従って、自動的にクラスタリングしている。ここでの特徴データは時間的に変動するケプストラムや波形のエネルギー・位相等を考えた。さらに時間変化の情報として、入力情報の速度や加速度も特徴データとして考慮した。これら性質の異なる特徴を、分割型クラスタリングネットワークによって自己組織化し、クラスタリングした。このクラスタリングは時間の変動に追従する必要があるし、学習データに対して誤認識を生じさせない程度にクラスタの生成・融合・消滅を行ない、その結果として未知データに対する汎化能力を向上させる必要があるので、いくつかの時間重みを導入し、適切に動作することを確認した。 3.上記のシステムはかなり計算複雑度が高いため、導入された設備を利用して連続音声認識と環境雑音認識実験を行なった。音声の認識には、アルゴリズムに対する有効性検討に対して多くの実験が必要である。特に不特定話者に対する認識はデータの分析や量も重要な問題であり、本研究では各研究機関で一般的に利用されているデータベースの中から幾つかの男性・女性音声を用いて認識実験を行なった。
|
-
[Publications] 清水淳也、宮永喜一、栃内香次: "マルチレート複素RLS法の追従性と浮動小数点誤差の解析" 電子情報通信学会論文誌. J78-A. 1316-1325 (1995)
-
[Publications] 宮永喜一、栃内香次: "自己組織化と教師によるネットワークの高速・高精度学習について" 電子情報通信学会論文誌. J78-A. 1475-1484 (1995)
-
[Publications] 近藤雅則、宮永喜一,栃内香次: "自己組織化クラスタリング機能を有する動的文字抽出ネットワーク" 電子情報通信学会論文誌. J78-A. 1645-1654 (1995)
-
[Publications] Yisheng Li,Yoshikazu Miyanaga and Koji Tochinai: "Nonlinear dynamics realization using a multi-port structured recurrent neural network" IEEE International Conference on Neural Networks and Signal Processing. 1. 136-139 (1995)
-
[Publications] Yoshikazu Miyanaga,Noriyuki Ohtsuki,Makoto Hiroshige and Koji Tochinai: "Parallel calculation of njonlinear signal processing using self-tuning network" International Symposium on Communications 1995. 1. 86-91 (1995)
-
[Publications] 李 移勝、宮永喜一、栃内香次: "構造化リカレントニューラルネットワークによる時系列の記憶と再生" 電子情報通信学会論文誌. J79-A. 29-37 (1996)