2007 Fiscal Year Annual Research Report
人の知覚認知処理機構に基づく音声の時間的側面の数理モデル構築
Project/Area Number |
16200016
|
Research Institution | Advanced Telecommunications Research Institute International |
Principal Investigator |
加藤 宏明 Advanced Telecommunications Research Institute International, 認知情報科学研究所, 主任研究員 (20374093)
|
Co-Investigator(Kenkyū-buntansha) |
匂坂 芳典 早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)
津崎 実 京都市立芸術大学, 音楽学部, 准教授 (60155356)
山田 玲子 株式会社国際電気通信基礎技術研究所, 認知情報科学研究所, 主幹研究員 (30395090)
田嶋 圭一 法政大学, 文学部, 准教授 (70366821)
|
Keywords | 知覚認知学習 / 音声言語情報処理 / 聴覚 / 時間的側面 / 韻律 / 音声言語習得 / 国際情報交換 / カナダ:タイ:アメリカ |
Research Abstract |
本研究の目的は,音声の韻律要素の中から時間的側面の評価について,人間が内的に行う処理を模擬するモデルを構築することである。言語に依存しない聴覚の基礎過程を扱う心理物理レベルと言語の違いに依存する処理を扱う言語レベルの2段階で研究を進め,それらの結果に立脚したモデルを構築する。平成19年度は,研究期間の最終年度にあたるため,2つのレベルでの研究成果を集約し学術論文として知識の定着を図るとともに,プロトタイプのモデルを構築してその性能を検証した。主要な成果は以下のとおりであった。 心理物理レベルでは,聴覚初期過程の機能を模擬した音事象検出アルゴリズムの高度化を図った。その結果,昨年度までに必要としていた最低限の言語知識をも用いないアルゴリズムを新たに構築することができた。これは,適用可能な言語の範囲に事実上制約がないという点で評価モデル構築の自由度を飛躍的に高める可能性を持つ。 言語レベルおよびモデルの構築では,日本語母語話者の英語音声を対象として時間的側面の自然性を自動評価するプロトタイプモデルを構築した。英語母語話者の教師音声を基準とした学習者音声の自然性劣化の程度を,両者の時間情報の違いから予測するモデルである。モデルの最大の特徴は,心理物理レベルの研究で得られた言語に依存しない聴知覚特性に基づく重み関数を導入した点である。この関数の導入による自動評価の精度向上も実験的に確認した。以上の結果は,このモデルの枠組みが,日本語母語話者の英語音声の評価のみならず,いかなる学習者母語と学習言語との組み合わせにおいても有効に働くであろうことを示している。
|
Research Products
(17 results)