2019 Fiscal Year Research-status Report
Project/Area Number |
18K19819
|
Research Institution | Osaka University |
Principal Investigator |
北澤 茂 大阪大学, 生命機能研究科, 教授 (00251231)
|
Project Period (FY) |
2018-06-29 – 2021-03-31
|
Keywords | カクテルパーティー効果 |
Outline of Annual Research Achievements |
私たちは、大勢の人が話しているパーティーでも相手の言うことを聞き取れる。脳はどのようにして声を聴き分けているのか。「カクテルパーティ問題」として50年以上研究されてきたにもかかわらず、手法上の制約から「私たちの脳は聞きたい音声にト ップダウンの注意を向けているらしい」ということしかわかっていない。本研究では、音声認識の能力を獲得した多層人工神経回路とヒトの脳の活動を詳細に比較して、カクテルパーティ問題の謎を解く。 本研究の第一段階では、標準的な音声認識の能力を獲得した多層人工神経回路の階層構造が、ヒトの脳の1次聴覚野(コア)―2次聴覚野(ベルト・パラベルト)―聴覚性言語野(ウェルニッケ野)に対応するかどうか、を明らかにすることを目的としていた。この点に関しては、昨年度までに既存のラベル付き単語音声データベースを用いて、単語弁別を行うように6層(入力層+4個の畳み込み層+出力層)の人工神経回路を誤差逆伝播法で学習させた上で、得られた人工神経回路の畳み込み層1から4の人工神経の応答特性を調べることで、音声認識の能力を獲得した多層人工神経回路の階層構造が、ヒトの脳の1次聴覚野(コア) ―2次聴覚野(ベルト・パラベルト)に至る階層構造と類似することを示すことに成功した。本年度は、第二段階として、第一段階で用いた標準的な人工神経回路の構成を基本として、同時に複数の音声入力を与えて学習させることで、カクテルパーティ問題を解く人工神経回路を育てることに取り組んだ。具体的には、刺激の前半では一名の音声を、公判では2名の音声を提示して、前半で提示された1名の音声を認識するように学習を行った。並行して、同様の試験をヒト被験者に対して行った。ヒトでは正解率8-9割を示す一方で、学習を行った6層人工神経回路の成績はヒトに及ばなかった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
第二段階では、第一段階で用いた標準的な人工神経回路の構成を基本として、同時に複数の音声入力を与えて学習させることで、カクテルパーティ問題を解く人工神経回路を育てることを計画していた。しかし、テストした6層人工神経回路では、並行して実験を行ったヒトに比肩する能力を持たせることができなかった。以上の点から上記区分の通りの判断とする。
|
Strategy for Future Research Activity |
テストした6層の神経回路を発展・改善する。例えば1)神経回路を巡回型にする、2)話者を区別する神経回路を別途用意して、両者の出力を並列して総合する、などの工夫を行う。改善のための試行錯誤を行うには、計算時間の短縮が必須である。そのため、GPUを複数備えたワークステーションを用いて、学習を繰り返し、ヒトと能力的にも構成的にも比較可能な人工神経回路を構築する。
|
Causes of Carryover |
実験は概ね予定通りに進んだが、解析に時間がかかり、今年度内に終了することが難しい。次年度もサーバレンタルを継続し、引き続き、解析を行う。
|
Research Products
(3 results)