Project/Area Number |
20H00291
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 25:Social systems engineering, safety engineering, disaster prevention engineering, and related fields
|
Research Institution | Aichi Shukutoku University |
Principal Investigator |
天野 成昭 愛知淑徳大学, 人間情報学部, 教授 (90396119)
|
Co-Investigator(Kenkyū-buntansha) |
近藤 眞理子 早稲田大学, 国際学術院, 教授 (00329054)
北原 真冬 上智大学, 外国語学部, 教授 (00343301)
坂野 秀樹 名城大学, 情報工学部, 教授 (20335003)
牧 勝弘 愛知淑徳大学, 人間情報学部, 教授 (50447033)
北村 達也 甲南大学, 知能情報学部, 教授 (60293594)
米山 聖子 大東文化大学, 外国語学部, 教授 (60365856)
田嶋 圭一 法政大学, 文学部, 教授 (70366821)
榊原 健一 北海道医療大学, リハビリテーション科学部, 准教授 (80396168)
山川 仁子 尚絅大学, 現代文化学部, 准教授 (80455196)
竹本 浩典 千葉工業大学, 先進工学部, 教授 (40374102)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥44,980,000 (Direct Cost: ¥34,600,000、Indirect Cost: ¥10,380,000)
Fiscal Year 2023: ¥10,790,000 (Direct Cost: ¥8,300,000、Indirect Cost: ¥2,490,000)
Fiscal Year 2022: ¥10,920,000 (Direct Cost: ¥8,400,000、Indirect Cost: ¥2,520,000)
Fiscal Year 2021: ¥10,920,000 (Direct Cost: ¥8,400,000、Indirect Cost: ¥2,520,000)
Fiscal Year 2020: ¥12,350,000 (Direct Cost: ¥9,500,000、Indirect Cost: ¥2,850,000)
|
Keywords | 音声知覚・生成 / 音声合成・変換 / 拡声音 / ポップアウト / 聞き取りやすさ / 音声知覚 / 音声生成 / 音声合成 / 音声変換 / 発声訓練法 |
Outline of Research at the Start |
雑音などの妨害音があっても非常に目立って聞き取りやすい音声をポップアウト・ボイスと呼ぶ。本研究では①ポップアウト・ボイスの音響物理的特性・生理的特性・知覚的特性・言語的特性を科学的に解明し,かつ②その科学的知見に基づいた技術的応用によってポップアウト・ボイスの音声合成方式,音声変換方式,および発声訓練法を開発する。このポップアウト・ボイスの技術的実現により,風雨の音などに妨害されて聞き取り難い防災無線等による避難情報等を確実に伝達できるように改善し,人々の命と安全の確保につなげる。
|
Outline of Annual Research Achievements |
①ポップアウトボイスの音響特徴側面: スピーカから流した音楽等をマイクロフォンで録音し,そのデータから室内空間の音響特性を推定する方法を開発した。この方法により耳の鼓膜に到達するポップアウトボイスに対し,室内空間の音響特性である反響等の影響を正確に知ることが可能となり,同時にポップアウトボイスに反響等の影響を加味した正確なシミュレーションも可能となった。また,音声が口から空間へ放射されるときの音響特性を測定する実験を行い,ポップアウトボイスが特徴的な音の伝わり方(指向性)を持つ可能性が高いことを示す結果を得た。 ②ポップアウトボイスの知覚側面: ポップアウトボイスの声質が迫力・金属性因子との関連が強いことを示す評定実験の結果を国際会議INTERSPEECH2022にて発表した。英語母語話者が日本語のポップアウトボイスを聴取したときの知覚特性を明らかにする目的で,ポップアウトボイスの検出率を測定する実験を実施した結果,非母語であることによる聞き取りやすさの低下は1.5~2.7dBであることと,ポップアウトボイスによる聞き取りやすさの上昇は2.8dBであることが分かった。特に後者の結果は,ポップアウトボイスが言語非依存の性質を持っていること,すなわち言語間の障壁を越えたユニバーサルデザインに応用可能であることを示唆する重要な結果であるといえる。 ③ポップアウトボイスの生成側面: 昨年度に引き続き,ポップアウトボイスを持つ話者と持たない話者,計11名の音声録音と電気声門図による声帯振動特性計測を実施した。さらに磁気共鳴機能画像法(fMRI)を用いて話者4名の口と喉の形状と動きのデータを収集した。これらのデータからポップアウトボイス発声時には通常発声時と異なる声帯振動特性が存在することを明らかにした。さらに口と喉の形状と動きも通常発生時とは異なることを示唆する結果を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
コロナ感染拡大の影響がまだ残っている状況であり,密閉空間である防音室での音声録音や多数の参加者を集めて行う音声知覚実験の実施には多少の困難が依然として伴うため,研究がやや遅れている。しかし,これまでの研究でポップアウトボイスの特徴が徐々に明らかとなってきており,音声変換方式の開発には大まかな目処もつきつつある。これらを総合すると,全体としては研究の進捗にやや遅れが生じているといえる。
|
Strategy for Future Research Activity |
①音響特徴側面においては,長時間スペクトルの形状を変化させる分析合成手法によるポップアウトボイスへの変換方式を構築する。さらに,知覚班とともに長時間スペクトルの形状以外のポップアウトボイスの音響特徴の解析を進め,時間的に変化する動的特徴を捉える。この動的特徴を加味したポップアウトボイスの変換方式と合成方式の構築を目指す。 ②知覚側面においては,上記の長時間スペクトルの形状を一定に揃えた音声セットを刺激とし,ポップアウトの程度を聴取実験によって測定する。その測定結果から,長時間スペクトルの形状以外の音響特徴を持つポップアウトボイスの候補を見つけ出す。見つけ出した候補を音響解析班へ送って解析を進め,ポップアウトボイスの特性の解明を目指す。 ③生成側面においては,磁気共鳴機能画像法(fMRI)による口の形状と動きのデータ収集を継続して進め,ポップアウトボイスの口の形状と動きと,音響特徴との対応関係の解析を進める。 さらに以上の3つの側面で得られたデータを統合・解析し,ポップアウトボイスの本質に迫る知見を得ることを目指す。
|