• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

構造不変の定理に基づく音声アフォーダンスの提案とそれに基づく音声認識系の構築

公募研究

研究領域情報爆発時代に向けた新しいIT基盤技術の研究
研究課題/領域番号 21013015
研究種目

特定領域研究

配分区分補助金
審査区分 理工系
研究機関東京大学

研究代表者

峯松 信明  東京大学, 大学院・情報理工学系研究科, 准教授 (90273333)

研究期間 (年度) 2009 – 2010
研究課題ステータス 完了 (2010年度)
配分額 *注記
6,900千円 (直接経費: 6,900千円)
2010年度: 3,400千円 (直接経費: 3,400千円)
2009年度: 3,500千円 (直接経費: 3,500千円)
キーワード音声アフォーダンス / 音声の構造的表象 / f-divergence / 外国語発音評定 / 音声認識 / 自閉症 / ゲシュタルト知覚 / 構造不変の定理 / 変換不変量 / 発音習熟度推定 / 非言語的要因
研究概要

音声の音色・声色は,発話者の発声器官サイズや形状の違いに依存するため,同一内容の発声であっても,音としては異なる。音色の違いは音空間の写像として捉えられるため,写像不変の計量を導出し,それのみを用いて音声を表象すれば,任意の写像(即ち,話者による違い)に対して頑健な音声処理が可能となる。本研究では,1)写像不変量の導出とそれに基づく音声アフォーダンスの提案,2)音声アフォーダンスに基づく孤立単語発声を対象とした音声認識系の構築と,連続音声認識への拡張,3)音声アフォーダンスに基づく外国語発音評定技術の構築と,従来技術との融合,4)音声アフォーダンスに基づく重度自閉症者の行動理解や,幼児の音声模倣に対する情報処理モデルの構築,について検討することを目的としており,特に本年度は,3)についての検討を行なった。外国語発音評価を行なう場合,教師音声と学習者音声をそのまま比較すれば声帯模写の上手下手を判定することになる。そこで,体格や年齢による声色のバイアスを除去した上で発音を表象し,両者を比較する技術を構築し,また従来の声帯模写評価的な,音声の絶対的特性に基づく技術との融合を図った。その結果,体格差に頑健に動作し,また(ミスマッチが少ない場合においても)従来手法より高い精度を示す技術を構築することに成功した。実際にデモシステムを用いた英語発音教育指導などの実践も行なった。これら成果は高い評価を受け,外国語学習に関する国内外の会議にて招待講演をする機会を得た。

報告書

(2件)
  • 2010 実績報告書
  • 2009 実績報告書
  • 研究成果

    (42件)

すべて 2011 2010 2009

すべて 雑誌論文 (24件) (うち査読あり 24件) 学会発表 (16件) 図書 (2件)

  • [雑誌論文] 音声の構造的表象と多段階の重回帰を用いた外国語発音評価2011

    • 著者名/発表者名
      鈴木雅之, 峯松信明, 広瀬啓吉
    • 雑誌名

      情報処理学会論文誌

      巻: 52 ページ: 1899-1909

    • NAID

      110008508020

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] 音声に含まれる言語的情報を非言語的情報から音響的に分離して抽出する手法の提案~人間らしい音声情報処理の実現に向けた一検討~2011

    • 著者名/発表者名
      峯松信明, 櫻庭京子, 西村多寿子, 喬宇, 朝川智, 鈴木雅之, 齋藤大輔
    • 雑誌名

      電子情報通信学会論文誌

      巻: J94-D ページ: 12-26

    • NAID

      110008006543

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] グローバル時代における英語発音とその科学的な分析方法2011

    • 著者名/発表者名
      峯松信明
    • 雑誌名

      大学英語教育学会関東支部学会誌

      巻: 7 ページ: 5-14

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Speech Structure and its Application to Robust Speech Processing2010

    • 著者名/発表者名
      N.Minematsu, Y.Qiao, S.Asakawa, M.Suzuki
    • 雑誌名

      Journal of New Generation Computing

      巻: 28 ページ: 299-319

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] A study of invariance of f-divergence and its application to speech recognition2010

    • 著者名/発表者名
      Y.Qiao, N.Minematsu
    • 雑誌名

      IEEE Trans.On Signal Processing

      巻: 58 ページ: 3884-3890

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Dialect-based speaker classification using speaker-invariant dialect features2010

    • 著者名/発表者名
      X.Ma, R.Xu, N.Minematsu, Y.Qiao, K.Hirose, A.Li
    • 雑誌名

      Proc.Int.Symposium on Chinese Spoken Language Processing

      巻: 1 ページ: 171-176

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Human speech model based on information separation and its application to speech processing2010

    • 著者名/発表者名
      N.Minematsu
    • 雑誌名

      Proc.Int.Symposium on Chinese Spoken Language Processing

      巻: 1 ページ: 477-482

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Improved generation of speech from its abstract and structural representation2010

    • 著者名/発表者名
      N.Minematsu, D.Saito, K.Hirose
    • 雑誌名

      Proc.Int.Conf.on Signal Processing

      巻: 1 ページ: 597-600

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Integration of multilayer regression with structure-based pronunciation assessment2010

    • 著者名/発表者名
      M.Suzuki, Y.Qiao, N.Minematsu, K.Hirose
    • 雑誌名

      Proc.INTERSPEECH

      巻: 1 ページ: 586-589

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Pronunciation proficiency estimation based on multilayer regression analysis using speaker-independent strucural features2010

    • 著者名/発表者名
      M.Suzuki, Y.Qiao, N.Minematsu, K.Hirose
    • 雑誌名

      Proc.Int.Workshop on Second Language Studies

      巻: 1(CD-ROM)

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Human speech model based on information separation--collection or separation, that is the question.--2010

    • 著者名/発表者名
      N.Minematsu
    • 雑誌名

      Proc.Int.Conf.on Electronic Speech Signal Processing

      巻: 1 ページ: 273-280

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] A modulation-demodulation model of speech communication2010

    • 著者名/発表者名
      N.Minematsu
    • 雑誌名

      Proc.Int.Conf.Speech Prosody

      巻: 1(CD-ROM)

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] A study of Hidden Structure Model and its application to labeling sequences2009

    • 著者名/発表者名
      Y.Qiao, M.Suzuki, N.Minematsu
    • 雑誌名

      Proc.Int.Workshop on Automatic Speech Recognition and Understanding

      ページ: 118-123

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Sub-structure-based estimation of pronunciation proficiency and classification of learners2009

    • 著者名/発表者名
      M.Suzuki, N.Minematsu, D.Luo, K.Hiro
    • 雑誌名

      Proc.Int.Workshop on Automatic Speech Recognition and Understanding

      ページ: 574-579

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Implementation of robust speech recognition by simulating infants' speech perception based on the invariant sound shape embedded in utterances2009

    • 著者名/発表者名
      N.Minematsu, S.Asakawa, Y.Qiao, D.Saito, T.Nishimura
    • 雑誌名

      Proc.Speech and Computer

      ページ: 35-40

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] A consideration of ASR based on animal evolution and human development-what should A of ASR stand for2009

    • 著者名/発表者名
      N.Minematsu
    • 雑誌名

      Proc.Int.Workshop on Computational Models of Language Evolution, Acquisition and Processing (CD-ROM)

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] On invariant structural representation for speech recognition : theoretical validation and experimental improvement2009

    • 著者名/発表者名
      Y.Qiao, S.Asakawa, N.Minematsu, K.Hirose
    • 雑誌名

      Proc.INTERSPEECH

      ページ: 3055-3058

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Structural analysis of dialects, sub-dialects, and sub-sub-dialects of Chinese2009

    • 著者名/発表者名
      X.Ma, A.Nemoto, N.Miriematsu, Y.Qiao, K.Hirose
    • 雑誌名

      Proc.INTERSPEECH

      ページ: 2219-2222

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Optimal event search using a structural cost function-improvement structure to speech conversion-2009

    • 著者名/発表者名
      D.Saito, Y.Qiao, N.Minematsu, K.Hirose
    • 雑誌名

      Proc.INTERSPEECH

      ページ: 2047-2050

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Improved structure-based automatic estimation of pronunciation proficiency2009

    • 著者名/発表者名
      M.Suzuki, L.Dean, N.Minematsu, K.Hirose
    • 雑誌名

      Proc.ISCA Tutorial and Research Workshop on Speech and Language Technology in Education (CD-ROM)

    • NAID

      110007990634

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Speech structure : a new framework of speech processing inspired from infants 'behaviors and animals' behaviors2009

    • 著者名/発表者名
      N.Minematsu
    • 雑誌名

      Proc.National Conference on Man-Machine Speech Communication

      ページ: 504-509

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Structural analysis of Chinese dialect speakers and their automatic classification2009

    • 著者名/発表者名
      X.Ma, N.Minematsu, A.Nemoto, M.Takazawa, Y.Qiao, K.Hirose
    • 雑誌名

      Proc.National Conference on Man-Machine Speech Communication

      ページ: 440-445

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Improvement of structure to speech conversion using iterative optimization2009

    • 著者名/発表者名
      D.Saito, Y.Qiao, N.Minematsu, K.Hirose
    • 雑誌名

      Proc.Speech and Computer

      ページ: 174-179

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Dialect-based speaker classification of Chinese using structural representation of pronunciation2009

    • 著者名/発表者名
      X.Ma, N.Minematsu, Y.Qiao, K.Hirose, A.Nemoto, F.Shi
    • 雑誌名

      Proc.Speech and Computer

      ページ: 350-355

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [学会発表] 情報の分離と音響モデリング~人間らしい音響モデリング~2011

    • 著者名/発表者名
      峯松信明
    • 学会等名
      日本音響学会春季全国大会
    • 発表場所
      早稲田大学
    • 年月日
      2011-03-10
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 声の物理的多様性とその認知的不変性~音声認識技術と自閉症の類似性~2010

    • 著者名/発表者名
      峯松信明, 西村多寿子, 櫻庭京子
    • 学会等名
      「コミュニケーションとリハビリテーションの現象学」研究会
    • 発表場所
      東京大学
    • 年月日
      2010-10-29
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 脳科学者と音声工学者が考える言葉との出会いとその演出2010

    • 著者名/発表者名
      峯松信明, 茂木健一郎
    • 学会等名
      外国語教育メディア学会50周年記念全国研究大会
    • 発表場所
      横浜市立横浜サイエンスフロンティア高等学校
    • 年月日
      2010-08-03
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 英語発音の物理現象を眺めていて気づくこと2010

    • 著者名/発表者名
      峯松信明
    • 学会等名
      外国語教育メディア学会50周年記念全国研究大会
    • 発表場所
      横浜市立横浜サイエンスフロンティア高等学校
    • 年月日
      2010-08-03
    • 関連する報告書
      2010 実績報告書
  • [学会発表] グローバル時代の英語発音とその科学的な分析方法2010

    • 著者名/発表者名
      峯松信明
    • 学会等名
      JACET関東支部大会
    • 発表場所
      東洋学園大学
    • 年月日
      2010-06-27
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討2009

    • 著者名/発表者名
      齋藤大輔, 松浦良, 峯松信明, 広瀬敬吉
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      東京大学
    • 年月日
      2009-12-21
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 二言語に渡る構造的表象に基づく音声・言語変換の実験的検討2009

    • 著者名/発表者名
      見原隆介, 齋藤大輔, 峯松信明, 広瀬啓吉
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      静岡大学
    • 年月日
      2009-11-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 構造評価関数を用いた構造的表象からの音声合成系の高精度化2009

    • 著者名/発表者名
      斎藤大輔, 喬宇, 峯松信明, 広瀬敬吉
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      静岡大学
    • 年月日
      2009-11-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 二言語に渡る構造的表象に基づく音声・言語変換の実験的検討2009

    • 著者名/発表者名
      見原隆介, 齋藤大輔, 峯松信明, 広瀬啓吉
    • 学会等名
      日本音響学会秋季全国大会
    • 発表場所
      日本大学
    • 年月日
      2009-09-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 発音構造を用いた話者の違いに頑健な発音評定・学習者分類2009

    • 著者名/発表者名
      鈴木雅之, 羅徳安, 峯松信明, 広瀬啓吉
    • 学会等名
      日本音響学会秋季全国大会
    • 発表場所
      日本大学
    • 年月日
      2009-09-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 音声事象の相対関係を音響単位とした未知語用音響モデルに関する実験的検討2009

    • 著者名/発表者名
      齋藤大輔, 松浦良, 峯松信明, 広瀬啓吉
    • 学会等名
      日本音響学会秋季全国大会
    • 発表場所
      日本大学
    • 年月日
      2009-09-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Proposal of Hidden Structure Model2009

    • 著者名/発表者名
      喬宇, 鈴木雅之, 峯松信明
    • 学会等名
      日本音響学会秋季全国大会
    • 発表場所
      日本大学
    • 年月日
      2009-09-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 音声情報処理技術を活用した英語発音の自動分類と発音矯正部位の自動推定2009

    • 著者名/発表者名
      峯松信明, 山内豊
    • 学会等名
      外国語教育メディア学会全国研究大会
    • 発表場所
      経済流通大学
    • 年月日
      2009-08-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] An Investigation of Hiden Structure Model2009

    • 著者名/発表者名
      喬宇, 鈴木雅之, 峯松信明
    • 学会等名
      情報処理学会音声言語情報処理研究会
    • 発表場所
      福島県飯坂温泉
    • 年月日
      2009-07-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 音声の構造的表象を用いた自動発音評定法の改善2009

    • 著者名/発表者名
      鈴木雅之, 羅徳安, 峯松信明, 広瀬啓吉
    • 学会等名
      情報処理学会音声言語情報処理研究会
    • 発表場所
      福島県飯坂温泉
    • 年月日
      2009-07-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Structural analysis of Chinese dialects and its experimental application to pronunciation assessment2009

    • 著者名/発表者名
      X.Ma, N.Minematsu, A.Nemoto, Y.Qiao, K.Hirose
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      福島県飯坂温泉
    • 年月日
      2009-07-01
    • 関連する報告書
      2009 実績報告書
  • [図書] Development of ERJ (English Read by Japanese) database for CALL research", in Computer processing of Asian spoken languages (in Computer processing of Asian spoken languages, edited by S.Itahashi and C.Tseng)2010

    • 著者名/発表者名
      N.Minematsu
    • 総ページ数
      5
    • 出版者
      Consideration Books
    • 関連する報告書
      2010 実績報告書
  • [図書] 「人間に近づく音声認識」(日経サイエンス6月号)2009

    • 著者名/発表者名
      峯松信明
    • 総ページ数
      6
    • 出版者
      日経サイエンス
    • 関連する報告書
      2009 実績報告書

URL: 

公開日: 2009-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi