• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

人間による音声言語処理過程の分析とそれに立脚した音声対話システムの構築

Research Project

Project/Area Number 13224024
Research Category

Grant-in-Aid for Scientific Research on Priority Areas (C)

Allocation TypeSingle-year Grants
Review Section Science and Engineering
Research InstitutionThe University of Tokyo

Principal Investigator

峯松 信明  東京大学, 大学院・情報理工学系研究科, 助教授 (90273333)

Co-Investigator(Kenkyū-buntansha) 広瀬 啓吉  東京大学, 大学院・新領域創世科学研究科, 教授 (50111472)
Project Period (FY) 2001 – 2003
Project Status Completed (Fiscal Year 2001)
Keywords年代の推定 / 知覚的年代 / 話者識別 / 韻律的特徴 / 音声対話システム / ヒューマンインターフェース / 高齢者福祉
Research Abstract

近年の計算機性能の飛躍的な向上,及び数理統計的なパラダイムに基づく音声処理/言語処理の高精度化によって,音声認識エンジンの性能は飛躍的に向上し,音声をインターフェイスとしたシステムやディクテーションシステムが,実用レベルでも見受けられるようになった。しかしながら従来の音声対話システム(特に認識エンジンを搭載した音声入力部)では,ユーザが発声する音声言語情報は一端認識エンジンによって文字化され,その文字列の中から必要な情報を抽出する,という処理体系のものが多い。本研究では,このようなパラダイムでは欠落してしまう情報に着眼し,特に,年齢に焦点をあて研究を行なった。具体的には,ユーザ(発話者)が高齢者か非高齢者か,という判断を自動的に高精度に行なう枠組みを構築した。
本研究では,話者の実年齢ではなく,聴取した時に感じる年代(知覚的年代)の推定を対象とするため,音声データベース中の各話者に対して知覚的年代のラベル付与から研究を開始した。'聴取実験によって各話者の年代を特定してもらい,その結果を用いてJNAS, S-JNASの2つのデータベース中の話者(約200名)を高齢者,非高齢者に分類した。次に,話者識別技術に基づいて,2つの話者グループのモデルをGMM(混合ガウス分布モデル)によってモデル化し,同定性能を実験的に調べたところ,91%の識別率が得られた。
この同定率向上を目的として,上記聴取実験の参加者に対して,何を基準として高齢話者と判断したのか,についてアンケート調査し,判断基準として用いられた音響的特徴について分析したところ,種々の韻律的特徴をキーとして判断している様子が観測された。そこで,候補となりえる韻律的特徴を同定実験を基に,その効果を分析したところ,発話速度と,パワーの局所的変動の2つが有効に寄与していることが分かった。最終的に話者識別技術に基づくモデリング(スコア)に,韻律に基づくスコアを加味することで,約95%まで同定率を上げることができた。また,実際にこの枠組みを音声インターフェイスの中に組み込むことを想定し,「高齢者と断定できた場合に可能となるサービス」についてもWoZ法に基づく実験を行ない,インターフェイスを構成する種々のパラメータ値の妥当性について予備的検討を行なった。その結果,高齢者向けのインターフェイスを積極的に導入することに対する種々の知見が得られた。

Report

(1 results)
  • 2001 Annual Research Report
  • Research Products

    (3 results)

All Other

All Publications (3 results)

  • [Publications] N, Minematsu 他: "Automatic Estimation of One's Age with His/her Speech based upon Acoustic Modeling Techniques of Speakers"Proc. ICASSP2002. (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] N, Minematsu 他: "Performance Improvement in Estimating Subjective Agedness with Prosodic Features"Proc. Speech Prosody 2002. (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] 関口 真理子 他: "話者認識技術を利用したユーザ世代の識別とその改良"電子情報通信学会音声研究会. SP2001-77. 31-38 (2001)

    • Related Report
      2001 Annual Research Report

URL: 

Published: 2003-04-03   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi