音声の構造的表象に基づく幼児の単語獲得過程の構成論的シミュレーション
Publicly Offered Research
Project Area | Elucidation of neural computation for prediction and decision making: toward better human understanding and applications |
Project/Area Number |
24120507
|
Research Category |
Grant-in-Aid for Scientific Research on Innovative Areas (Research in a proposed research area)
|
Allocation Type | Single-year Grants |
Review Section |
Complex systems
|
Research Institution | The University of Tokyo |
Principal Investigator |
峯松 信明 東京大学, 工学(系)研究科(研究院), 教授 (90273333)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Project Status |
Completed (Fiscal Year 2013)
|
Budget Amount *help |
¥10,920,000 (Direct Cost: ¥8,400,000、Indirect Cost: ¥2,520,000)
Fiscal Year 2013: ¥5,460,000 (Direct Cost: ¥4,200,000、Indirect Cost: ¥1,260,000)
Fiscal Year 2012: ¥5,460,000 (Direct Cost: ¥4,200,000、Indirect Cost: ¥1,260,000)
|
Keywords | 音声の構造的表象 / f-divergence / ゲシュタルト知覚 / 言語獲得モデル / シミュレーション / 言語リズム / 単語認識実験 |
Outline of Annual Research Achievements |
本研究は,音声の構造的表象を用いて幼児の言語獲得,特に単語獲得プロセスを構成論的にシミュレーションすることを目的としている。幼児の言語獲得は他者の発声を模倣することが基本であると考えられるが,声帯模写のような音真似をする訳ではない。音声には話者情報,年齢情報など様々な情報が含まれるが,それらを無視し,音声の言語情報,言語メッセージだけを真似る。この場合「発声を音素列のようなものとして表象し,個々の音素を再度発声する」というという仮説も可能であるが,音素意識が未熟であるため不適 切な仮説である。音声の構造的表象は,発声の全体像を,話者非依存に表象できる興味深い特徴量抽出法である。音声には体格や年齢に起因する声色のバイアスが必ず存在するが,そのバイアスを捨象し,残された言語の骨格とも言える部分が構造的表象となる。従来より,構造表象を用いた単語認識系は構築されていたが,本研究ではこれを幼児の単語獲得プロセスの技術的一実装であると位置づける。そして,幼児は言語リズムに敏感であるとの知見を反映し,構造表象に基づく入力音声と単語モデル照合処理において,sonority (聞こえ度)最大区間,即ちシラブル中心を検出し,それに基づくシラブル内照合とシラブル間照合という処理を導入し,音声構造に基づく単語認識系の精度向上を実現した。
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|
Report
(2 results)
Research Products
(12 results)
-
-
-
-
-
-
-
-
-
-
-
[Presentation] こどばって一体何だろう?2012
Author(s)
峯松信明
Organizer
日私小連全国教育夏季研究会外国語部会
Place of Presentation
アルカディア市ヶ谷(東京都千代田区)
Year and Date
2012-08-21
Related Report
Invited
-