公募研究
本研究は,音声の構造的表象を用いて幼児の言語獲得,特に単語獲得プロセスを構成論的にシミュレーションすることを目的としている。幼児の言語獲得は他者の発声を模倣することが基本であると考えられるが,声帯模写のような音真似をする訳ではない。音声には話者情報,年齢情報など様々な情報が含まれるが,それらを無視し,音声の言語情報,言語メッセージだけを真似る。この場合「発声を音素列のようなものとして表象し,個々の音素を再度発声する」というという仮説も可能であるが,音素意識が未熟であるため不適切な仮説である。音声の構造的表象は,発声の全体像を,話者非依存に表象できる興味深い特徴量抽出法である。音声には体格や年齢に起因する声色のバイアスが必ず存在するが,そのバイアスを捨象し,残された言語の骨格とも言える部分が構造的表象となる。従来より,構造表象を用いた単語認識系は構築されていたが,本研究ではこれを幼児の単語獲得プロセスの技術的一実装であると位置づける。そして,幼児は言語リズムに敏感であるとの知見を反映し,構造表象に基づく入力音声と単語モデル照合処理において,sonority(聞こえ度)最大区間,即ちシラブル中心を検出し,それに基づくシラブル内照合とシラブル間照合という処理を導入し,音声構造に基づく単語認識系の精度向上を実現した。
26年度が最終年度であるため、記入しない。
すべて 2014 2013
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (2件) (うち招待講演 1件)
IEEE Trans. Systems, Man & Cybernetics
巻: 7 ページ: 577-586
Proc. ASRU
巻: 1 ページ: 222-227
Proc. APSIPA
巻: 1 ページ: CD-ROM