研究概要 |
音声(環境音も含めて考える)を人工内耳の20チャネルの電極パルスに効率良く変換する。このため、音声符号化方式で常用されるマルチパルス音声符号化を適用して最適なパルス位置(時間軸上)と蝸牛内基底膜軸上電極位置(周波数)を決定する時間・周波数空間の最適解を求めようとした。最適基準の問題点の見直しを行った結果、波形およびスペクトルの最小2乗誤差基準による方法で良好な結果が得られた。 電極パルス刺激による聴神経発火パターンの生理実験モデルに基づく音響シミュレーションシステムを作成した。これによって、電極刺激信号から精度の良い音響シミュレーションが行えるようになった。 聴覚末梢系の生理モデルの逆過程をたどって、聴神経の発火パターンから入力の音響信号を再現した。神経伝達物質から基底膜振動を復元する非線形モデルの逆問題を種々の制約条件を考慮して、歪のない入力音を再生するように「逆聴覚モデル」を作成した。 人工内耳装用者がどのような『音』を聞いているのか。果たして「音響シミュレーション」が人工内耳装用者の聴取している「音」に対応しているのかという疑問に何らかの手掛りを得たいと考えて、浜松医科大学で人工内耳を埋め込んだ数十名に詳しくインタビューを行った。その結果、音響シミュレーションで模擬しているのは人工内耳への音入れの瞬間の「音」に近いこと、その後,人工内耳装用者は急速に(数分以内に)学習し、かつて聴取していた記憶のある「音」と関連付けを行い、数ヶ月後には昔のように聞えている(というつもりになるようである)。 音響シミュレーションでは信号合成上の技術的問題の所為でしばしば音の歪や雑音の混入が起こるが,このような問題は人工内耳装用者にとっては全くの無関係な問題であることが明らかになった。従って、音響シミュレーション時に不要な歪を生じたことによって人工内耳音の音質評価を誤ってはならないといえる。
|