2012 Fiscal Year Annual Research Report
音声の構造的表象に基づく幼児の単語獲得過程の構成論的シミュレーション
Publicly Offered Research
Project Area | Elucidation of neural computation for prediction and decision making: toward better human understanding and applications |
Project/Area Number |
24120507
|
Research Institution | The University of Tokyo |
Principal Investigator |
峯松 信明 東京大学, 工学(系)研究科(研究院), 教授 (90273333)
|
Project Period (FY) |
2012-04-01 – 2014-03-31
|
Keywords | 音声の構造的表象 / f-divergence / ゲシュタルト知覚 / 言語獲得モデル / シミュレーション / 言語リズム / 単語認識実験 |
Outline of Annual Research Achievements |
本研究は,音声の構造的表象を用いて幼児の言語獲得,特に単語獲得プロセスを構成論的にシミュレーションすることを目的としている。幼児の言語獲得は他者の発声を模倣することが基本であると考えられるが,声帯模写のような音真似をする訳ではない。音声には話者情報,年齢情報など様々な情報が含まれるが,それらを無視し,音声の言語情報,言語メッセージだけを真似る。この場合「発声を音素列のようなものとして表象し,個々の音素を再度発声する」というという仮説も可能であるが,音素意識が未熟であるため不適切な仮説である。音声の構造的表象は,発声の全体像を,話者非依存に表象できる興味深い特徴量抽出法である。音声には体格や年齢に起因する声色のバイアスが必ず存在するが,そのバイアスを捨象し,残された言語の骨格とも言える部分が構造的表象となる。従来より,構造表象を用いた単語認識系は構築されていたが,本研究ではこれを幼児の単語獲得プロセスの技術的一実装であると位置づける。そして,幼児は言語リズムに敏感であるとの知見を反映し,構造表象に基づく入力音声と単語モデル照合処理において,sonority (聞こえ度)最大区間,即ちシラブル中心を検出し,それに基づくシラブル内照合とシラブル間照合という処理を導入し,音声構造に基づく単語認識系の精度向上を実現した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
音声構造に基づく単語認識系を幼児の単語獲得プロセスの一実装として位置づけ,幼児が言語リズムに敏感であるとの知見を技術的に実装することで,認識精度の向上を実現しており,おおむね予定通りの成果が出ている。また構造表象に関する対外発表も行なっている。
|
Strategy for Future Research Activity |
現在の実装は,教師有りの単語認識系の構築であり,より適切な幼児の単語獲得シミュレーションを実現する場合,教師無しの学習,即ち,音声スペクトルからのパターン発見として実現する必要がある。次年度以降,これを目指すと共に,幼児の言語獲得研究から得られた知見を生かしたアプリケーション開発なども目指す。
|
-
-
-
-
-
-
[Presentation] こどばって一体何だろう?2012
Author(s)
峯松信明
Organizer
日私小連全国教育夏季研究会外国語部会
Place of Presentation
アルカディア市ヶ谷(東京都千代田区)
Year and Date
2012-08-21 – 2012-08-22
Invited
-