研究領域 | 予測と意思決定の脳内計算機構の解明による人間理解と応用 |
研究課題/領域番号 |
24120507
|
研究機関 | 東京大学 |
研究代表者 |
峯松 信明 東京大学, 工学(系)研究科(研究院), 教授 (90273333)
|
研究期間 (年度) |
2012-04-01 – 2014-03-31
|
キーワード | 音声の構造的表象 / f-divergence / ゲシュタルト知覚 / 言語獲得モデル / シミュレーション / 言語リズム / 単語認識実験 |
研究実績の概要 |
本研究は,音声の構造的表象を用いて幼児の言語獲得,特に単語獲得プロセスを構成論的にシミュレーションすることを目的としている。幼児の言語獲得は他者の発声を模倣することが基本であると考えられるが,声帯模写のような音真似をする訳ではない。音声には話者情報,年齢情報など様々な情報が含まれるが,それらを無視し,音声の言語情報,言語メッセージだけを真似る。この場合「発声を音素列のようなものとして表象し,個々の音素を再度発声する」というという仮説も可能であるが,音素意識が未熟であるため不適切な仮説である。音声の構造的表象は,発声の全体像を,話者非依存に表象できる興味深い特徴量抽出法である。音声には体格や年齢に起因する声色のバイアスが必ず存在するが,そのバイアスを捨象し,残された言語の骨格とも言える部分が構造的表象となる。従来より,構造表象を用いた単語認識系は構築されていたが,本研究ではこれを幼児の単語獲得プロセスの技術的一実装であると位置づける。そして,幼児は言語リズムに敏感であるとの知見を反映し,構造表象に基づく入力音声と単語モデル照合処理において,sonority (聞こえ度)最大区間,即ちシラブル中心を検出し,それに基づくシラブル内照合とシラブル間照合という処理を導入し,音声構造に基づく単語認識系の精度向上を実現した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
音声構造に基づく単語認識系を幼児の単語獲得プロセスの一実装として位置づけ,幼児が言語リズムに敏感であるとの知見を技術的に実装することで,認識精度の向上を実現しており,おおむね予定通りの成果が出ている。また構造表象に関する対外発表も行なっている。
|
今後の研究の推進方策 |
現在の実装は,教師有りの単語認識系の構築であり,より適切な幼児の単語獲得シミュレーションを実現する場合,教師無しの学習,即ち,音声スペクトルからのパターン発見として実現する必要がある。次年度以降,これを目指すと共に,幼児の言語獲得研究から得られた知見を生かしたアプリケーション開発なども目指す。
|