2010 Fiscal Year Annual Research Report
ヒト蝸牛内聴覚系の精密分子モデルとその音声認識他への応用
Project/Area Number |
21650039
|
Research Institution | Yamaguchi University |
Principal Investigator |
内野 英治 山口大学, 大学院・理工学研究科, 教授 (30168710)
|
Co-Investigator(Kenkyū-buntansha) |
末竹 規哲 山口大学, 大学院・理工学研究科, 准教授 (80334051)
畔津 忠博 山口県立大学, 情報化推進室, 准教授 (70285451)
|
Keywords | 聴覚末梢系 / 聴覚分子モデル / 人工蝸牛 / 音声認識 |
Research Abstract |
ヒトの聴覚系は,非常に高機能な情報処理を行っている.これは,現在広く使用されている音声情報処理システムより,はるかに柔軟性に優れた性能といえる.ヒトは音を,音波の耳介への到来→鼓膜振動→蝸牛内リンパ液振動→基底膜振動→基底膜上の有毛細胞の活性化→有毛細胞から神経パルスの発生→大脳聴覚野,と言う順を追って認識している. 本研究の目的は,音波の耳への到来から有毛細胞における神経パルスの発生までの一連のプロセスを,数理モデルとして完成させ,また,この数理モデルを人工音声認識システムに組込むことにより,さらに高性能な音声認識システム,更には,ヒトの脳に近いコンピュータ(ブレインコンピュータ)のバイオミメティックな優れた音声入力装置の基礎を築くことである.以下が本年度の研究実績の概要である. (1)外耳道から有毛細胞に至るトータルモデルの完成と性能評価 音波(空気の振動)の耳介への到来から,耳介→外耳道→鼓膜の振動→耳小骨→蝸牛内リンパの振動→基底膜の振動→基底膜上の有毛細胞の活性化→有毛細胞から神経パルスの発生,までの一連のプロセスモデルを完成させ,全体としての性能評価を行った. (2)神経パルス列を用いた話者識別および音声認識モデルの構築 (1)で生成された神経パルス列を用いて,話者個人の特徴量の抽出による話者識別モデルを構築した.従来のモデルより性能が高いことを確認した (3)本モデルを用いた各種応用システムの検討 本モデルで得られた順応現象や周波数選択性の特徴を,いかに実応用システムに取り入れて行くかに付き検討を行った.また,このモデルが脳の高次機能(音源定位機能,聴覚の情景分析,カクテルパーティ効果など)を説明する糸口になるかについても考察した.
|