2012 年度実績報告書

音声の構造的表象に基づく幼児の単語獲得過程の構成論的シミュレーション

公募研究

研究領域	予測と意思決定の脳内計算機構の解明による人間理解と応用
研究課題/領域番号	24120507
研究機関	東京大学
研究代表者	峯松信明東京大学, 工学(系)研究科(研究院), 教授 (90273333)
研究期間 (年度)	2012-04-01 – 2014-03-31
キーワード	音声の構造的表象 / f-divergence / ゲシュタルト知覚 / 言語獲得モデル / シミュレーション / 言語リズム / 単語認識実験
研究実績の概要	本研究は，音声の構造的表象を用いて幼児の言語獲得，特に単語獲得プロセスを構成論的にシミュレーションすることを目的としている。幼児の言語獲得は他者の発声を模倣することが基本であると考えられるが，声帯模写のような音真似をする訳ではない。音声には話者情報，年齢情報など様々な情報が含まれるが，それらを無視し，音声の言語情報，言語メッセージだけを真似る。この場合「発声を音素列のようなものとして表象し，個々の音素を再度発声する」というという仮説も可能であるが，音素意識が未熟であるため不適切な仮説である。音声の構造的表象は，発声の全体像を，話者非依存に表象できる興味深い特徴量抽出法である。音声には体格や年齢に起因する声色のバイアスが必ず存在するが，そのバイアスを捨象し，残された言語の骨格とも言える部分が構造的表象となる。従来より，構造表象を用いた単語認識系は構築されていたが，本研究ではこれを幼児の単語獲得プロセスの技術的一実装であると位置づける。そして，幼児は言語リズムに敏感であるとの知見を反映し，構造表象に基づく入力音声と単語モデル照合処理において，sonority （聞こえ度）最大区間，即ちシラブル中心を検出し，それに基づくシラブル内照合とシラブル間照合という処理を導入し，音声構造に基づく単語認識系の精度向上を実現した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由音声構造に基づく単語認識系を幼児の単語獲得プロセスの一実装として位置づけ，幼児が言語リズムに敏感であるとの知見を技術的に実装することで，認識精度の向上を実現しており，おおむね予定通りの成果が出ている。また構造表象に関する対外発表も行なっている。
今後の研究の推進方策	現在の実装は，教師有りの単語認識系の構築であり，より適切な幼児の単語獲得シミュレーションを実現する場合，教師無しの学習，即ち，音声スペクトルからのパターン発見として実現する必要がある。次年度以降，これを目指すと共に，幼児の言語獲得研究から得られた知見を生かしたアプリケーション開発なども目指す。

研究成果
(7件)

すべて 2013 2012

すべて雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件) (うち招待講演 1件) 図書 (1件)

[雑誌論文] An experimental study on dynamic features of speech structure2012
- 著者名/発表者名
  S. Shimizu, M. Suzuki, N. Minematsu, and K. Hirose
- 雑誌名
  
  Journal of Research Institute of Signal Processing
  
  巻: 16 ページ: 319, 322
- 査読あり
[雑誌論文] Discriminative reranking for LVCSR leveraging invariant structure2012
- 著者名/発表者名
  M. Suzuki, G. Kurata, M. Nishimura, N. Minematsu,
- 雑誌名
  
  Proc. INTERSPEECH
  
  巻: 1 ページ: CD-ROM
- 査読あり
[学会発表] 波形包絡を用いた音節核の自動抽出とそれを用いた構造的表象による単語獲得プロセスのモデル化の初期検討2012
- 著者名/発表者名
  尾崎洋輔, 峯松信明, 広瀬啓吉, Donna Erickson,
- 学会等名
  電子情報通信学会音声研究会
- 発表場所
  東京工業大学（東京都目黒区）
- 年月日
  2012-12-20 – 2012-12-21
[学会発表] 波形包絡を用いた音節核の自動抽出とそれを用いた構造的表象による単語獲得プロセスのモデル化2012
- 著者名/発表者名
  尾崎洋輔，峯松信明，広瀬啓吉，エリクソン・ドナ，
- 学会等名
  日本音響学会秋季研究発表会
- 発表場所
  信州大学（長野県松本市）
- 年月日
  2012-09-19 – 2012-09-21
[学会発表] 音声の構造的表象を用いた大語彙音声認識の識別的リランキング，2012
- 著者名/発表者名
  鈴木雅之，倉田岳人，西村雅史，峯松信明，広瀬啓吉，
- 学会等名
  日本音響学会秋季研究発表会
- 発表場所
  信州大学（長野県松本市）
- 年月日
  2012-09-19 – 2012-09-21
[学会発表] こどばって一体何だろう？2012
- 著者名/発表者名
  峯松信明
- 学会等名
  日私小連全国教育夏季研究会外国語部会
- 発表場所
  アルカディア市ヶ谷（東京都千代田区）
- 年月日
  2012-08-21 – 2012-08-22
- 招待講演
[図書] 音声言語処理と自然言語処理2013
- 著者名/発表者名
  中川聖一，小林聡，峯松信明，宇津呂武仁，秋葉友良，北岡教英，山本幹雄，甲斐充彦，山本一公，土屋雅稔
- 総ページ数
  252
- 出版者
  コロナ社

2012 年度 実績報告書

音声の構造的表象に基づく幼児の単語獲得過程の構成論的シミュレーション

研究代表者

峯松 信明 東京大学, 工学(系)研究科(研究院), 教授 (90273333)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] An experimental study on dynamic features of speech structure2012

著者名/発表者名

雑誌名

[雑誌論文] Discriminative reranking for LVCSR leveraging invariant structure2012

著者名/発表者名

雑誌名

[学会発表] 波形包絡を用いた音節核の自動抽出とそれを用いた構造的表象による単語獲得プロセスのモデル化の初期検討2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 波形包絡を用いた音節核の自動抽出とそれを用いた構造的表象による単語獲得プロセスのモデル化2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声の構造的表象を用いた大語彙音声認識の識別的リランキング，2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] こどばって一体何だろう？2012

著者名/発表者名

学会等名

発表場所

年月日

[図書] 音声言語処理と自然言語処理2013

著者名/発表者名

総ページ数

出版者

2012 年度実績報告書

峯松信明東京大学, 工学(系)研究科(研究院), 教授 (90273333)