研究課題/領域番号 |
16700155
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 大阪産業大学 |
研究代表者 |
平松 綾子 大阪産業大学, 工学部, 講師 (70309178)
|
研究期間 (年度) |
2004 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
1,400千円 (直接経費: 1,400千円)
2005年度: 900千円 (直接経費: 900千円)
2004年度: 500千円 (直接経費: 500千円)
|
キーワード | 交通事故 / 音源識別 / ニューラルネットワーク / 集団学習 / 環境音識別 / ニューラルネット / バギング / アダブースト |
研究概要 |
本研究では、事故事例や危険事例を監視カメラに記録させる際のきっかけとなる音の認識精度の向上を目的とする。音の音色の性質である周波数分析した結果を用い、その特徴をニューラルネットワークにより学習する。さらに、集団学習を適用することで、ネットワーク構成やパラメータ調整の試行錯誤を十分行うことなく、識別性能が向上すると期待できる。そこで、ニューラルネットを用いた集団学習により交差点で発生する環境音の音源識別する方法を提案した。集団学習には、代表的な手法であるバギングとアダブーストをニューラルネットと共に用いた。集団学習を取り入れることで、識別性能向上を目指している。 昨年度までに、基本的なニューラルネットワークを識別器とした2種類の集団学習プログラムを作成し、簡単な実験により集団学習の特徴を検討した。しかしながら、基本的にデータが不足しているため実用に耐えうるだけの認識精度を提供することができるかどうかの検証はできていなかった。そこで、学習用の入力データ不足に対応するために、1つの事例から複数の学習用データを採取する方法を検討した。既存の方法では1つの事例に対し鳴り始めのデータのみを用いていたが、音を発している区間で複数のデータの採取を試みた。これに伴い、認識方法として、鳴り始め時点での認識ではなく、音が発生している間判定を逐次行い総合的に認識する方法の検討をした。また、入力とする1つデータにどの程度の長さの音を含めるか再検討を行い、既存の方法で用いた約0.1秒が最も認識率が良くなることを確認した。
|