2013 年度実績報告書

音声の構造的表象に基づく幼児の単語獲得過程の構成論的シミュレーション

公募研究

研究領域	予測と意思決定の脳内計算機構の解明による人間理解と応用
研究課題/領域番号	24120507
研究機関	東京大学
研究代表者	峯松信明東京大学, 工学(系)研究科(研究院), 教授 (90273333)
研究期間 (年度)	2012-04-01 – 2015-03-31
キーワード	音声の構造的表象 / f-divergence / ゲシュタルト知覚 / 言語獲得モデル / シミュレーション / 言語リズム / 単語認識実験
研究実績の概要	本研究は，音声の構造的表象を用いて幼児の言語獲得，特に単語獲得プロセスを構成論的にシミュレーションすることを目的としている。幼児の言語獲得は他者の発声を模倣することが基本であると考えられるが，声帯模写のような音真似をする訳ではない。音声には話者情報，年齢情報など様々な情報が含まれるが，それらを無視し，音声の言語情報，言語メッセージだけを真似る。この場合「発声を音素列のようなものとして表象し，個々の音素を再度発声する」というという仮説も可能であるが，音素意識が未熟であるため不適切な仮説である。音声の構造的表象は，発声の全体像を，話者非依存に表象できる興味深い特徴量抽出法である。音声には体格や年齢に起因する声色のバイアスが必ず存在するが，そのバイアスを捨象し，残された言語の骨格とも言える部分が構造的表象となる。従来より，構造表象を用いた単語認識系は構築されていたが，本研究ではこれを幼児の単語獲得プロセスの技術的一実装であると位置づける。そして，幼児は言語リズムに敏感であるとの知見を反映し，構造表象に基づく入力音声と単語モデル照合処理において，sonority （聞こえ度）最大区間，即ちシラブル中心を検出し，それに基づくシラブル内照合とシラブル間照合という処理を導入し，音声構造に基づく単語認識系の精度向上を実現した。
現在までの達成度 (段落)	26年度が最終年度であるため、記入しない。
今後の研究の推進方策	26年度が最終年度であるため、記入しない。

研究成果
(5件)

すべて 2014 2013

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (2件) (うち招待講演 1件)

[雑誌論文] Unsupervised optimal phoneme segmentation: theory and experimental evaluation2013
- 著者名/発表者名
  Y. Qiao, D. Luo, N. Minematsu
- 雑誌名
  
  IEEE Trans. Systems, Man & Cybernetics
  
  巻: 7 ページ: 577-586
- 査読あり
[雑誌論文] Automatic pronunciation clustering using a world English archive and pronunciation structure analysis2013
- 著者名/発表者名
  H.-P. Shen, N. Minematsu, T. Makino, S. H. Weinberger, T. Pongkittiphan, C.-H. Wu,
- 雑誌名
  
  Proc. ASRU
  
  巻: 1 ページ: 222-227
- 査読あり
[雑誌論文] Speaker-invariant and rhythm-sensitive representation of spoken words2013
- 著者名/発表者名
  N. Minematsu, Y. Ozaki, K. Hirose, D. Erickson
- 雑誌名
  
  Proc. APSIPA
  
  巻: 1 ページ: CD-ROM
- 査読あり
[学会発表] 音声の構造的表象による頑健な教師無し語彙獲得システム2014
- 著者名/発表者名
  尾崎洋輔，齋藤大輔，峯松信明，広瀬啓吉
- 学会等名
  日本音響学会春季講演論文集
- 発表場所
  日本大学（東京）
- 年月日
  2014-03-10 – 2014-03-12
[学会発表] 音声信号における特徴量分離と情報分離2013
- 著者名/発表者名
  峯松信明
- 学会等名
  情報処理学会音楽情報処理研究会
- 発表場所
  お茶の水女子大学（東京）
- 年月日
  2013-05-11 – 2013-05-12
- 招待講演

2013 年度 実績報告書

音声の構造的表象に基づく幼児の単語獲得過程の構成論的シミュレーション

研究代表者

峯松 信明 東京大学, 工学(系)研究科(研究院), 教授 (90273333)

研究成果

[雑誌論文] Unsupervised optimal phoneme segmentation: theory and experimental evaluation2013

著者名/発表者名

雑誌名

[雑誌論文] Automatic pronunciation clustering using a world English archive and pronunciation structure analysis2013

著者名/発表者名

雑誌名

[雑誌論文] Speaker-invariant and rhythm-sensitive representation of spoken words2013

著者名/発表者名

雑誌名

[学会発表] 音声の構造的表象による頑健な教師無し語彙獲得システム2014

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声信号における特徴量分離と情報分離2013

著者名/発表者名

学会等名

発表場所

年月日

2013 年度実績報告書

峯松信明東京大学, 工学(系)研究科(研究院), 教授 (90273333)