2022 Fiscal Year Annual Research Report

Foundation of speech communication support based on auditory perception models for everyone including elderly persons with hearing impairment

Research Project

Project/Area Number	21H03468
Research Institution	Wakayama University
Principal Investigator	入野俊夫和歌山大学, システム工学部, 教授 (20346331)
Co-Investigator(Kenkyū-buntansha)	松井淑恵豊橋技術科学大学, エレクトロニクス先端融合研究所, 教授 (10510034) 小林洋介室蘭工業大学, 大学院工学研究科, 助教 (10735103) 坂野秀樹名城大学, 情報工学部, 教授 (20335003)
Project Period (FY)	2021-04-01 – 2024-03-31
Keywords	音声聴覚支援 / 音声了解度 / 模擬難聴 / 客観評価指標 / 主観評価 / 聴覚モデル / 音声明瞭度 / 難聴
Outline of Annual Research Achievements	研究実績の概要【1】聴覚末梢系特性の的確な推定と聴覚末梢モデルGCFBの高精度化: 聴覚フィルタ推定において絶対閾値とレベル依存雑音を導入し再計算した結果インパクトの高い結果が得られた。論文投稿して条件付き採録となった。GCFBの改良版に関しても、以下のWHISの論文に含めて記述した。【2】模擬難聴システムWHISへの時間応答特性劣化の導入と高度化: 模擬難聴システムWHISの論文に関して、内容の充実と記述の洗練化を行った上で投稿準備をした（R5年4月に投稿完了)。時間応答特性劣化の導入に関して、この過程で見通しを得ることができた。【3】高齢難聴者の音声/環境音知覚特性の明確化: WHISを用いた健聴者での音声了解度実験を、昨年の男声に引き続き女声に関しても、防音室とクラウドソーシング遠隔実験で行った。その際、R3年度に開発したデータスクリーニング手法(今年度国際会議発表済)を、参加者の事前スクリーニングにも適用すると結果のばらつきをかなり抑えられることも示した。この他にも、理想的な強調処理の音声了解度実験も防音室とクラウド遠隔で実施した。R5には高齢者実験も再開できる見込みで、これらから得られた知見は有効に活用できると考えられる。【4】明瞭音声特徴量の抽出と高齢難聴者対応の音声了解度客観評価指標の開発: 【3】で示した実験データを非常によく予測できる新しい客観評価指標GESI に関して国際会議で発表し、特許申請も行った。さらに、男声データだけからパラメータを推定して女声データを予測することや、個人ごとの限られたデータだけを用いて予測するテストを行い、従来手法よりも良く精度を達成できることを示した。これらをまとめて論文投稿準備を行った。さらに音声認識器を用いた客観評価指標も提案した。高齢難聴者の了解度予測を行う国際競技会にも参加し、上位につけることができた。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 【1】に関してR3年度で完成し終了したと考えていた。しかし、今年度追加検討した結果、当初思っていた以上のインパクトがある成果を出すことができ、投稿できた。【2】の時間応答導入は難しい課題で、なかなか進まなかったが、WHIS論文の洗練化を通して見通しを得た。今後に期待できる。【3】【4】に関してはおおむね計画どおりである。
Strategy for Future Research Activity	【1】聴覚末梢系特性の的確な推定と聴覚末梢モデルGCFBの高精度化: 投稿済みの論文掲載を目指し、査読対応を行う。論文掲載後に、新しく得られたパラメータ値をGCFBに導入して公開する。【2】模擬難聴システムWHISへの時間応答特性劣化の導入と高度化: 時間応答特性劣化の模擬に関して、新しいアイデアに基づいて実装を行い的確に模擬できるかを調べる。雑音が不可避であった従来手法と比較する聴取実験も行う。【3】高齢難聴者の音声/環境音知覚特性の明確化: コロナの5類移行に伴い、難聴高齢者実験を再開する。また、WHISでオージオグラムを一致させた健聴者実験を行う。さらに、難聴高齢者の時間応答特性の計測も行い、WHISでの模擬との対比もできるように進める。【4】明瞭音声特徴量の抽出と高齢難聴者対応の音声了解度客観評価指標の開発: 昨年度の成果の論文化を目指す。GESIを、音声強調処理やWHISを用いたさまざまな実験データに適用して、その有効性を示す。さらにGESIが時間応答特性の劣化にも対応できるか【3】の実験結果に基づいて検討する。問題点があった場合、改善を目指す。これは聴覚中枢系の一部のモデル化に相当する。さらに認知系の要因による機能低下分も【3】の実験結果から推測できる可能性もあるので、これに対応する認知モデルの検討を行う。

Research Products
(28 results)

All 2023 2022 Other

All Int'l Joint Research (1 results) Journal Article (2 results) (of which Int'l Joint Research: 1 results, Peer Reviewed: 1 results) Presentation (24 results) (of which Int'l Joint Research: 6 results) Patent(Industrial Property Rights) (1 results)

[Int'l Joint Research] University of Cambridge(英国)
- Country Name
  UNITED KINGDOM
- Counterpart Institution
  University of Cambridge
[Journal Article] Modelling speaker-size discrimination with voiced and unvoiced speech sounds based on the effect of spectral lift2022
- Author(s)
  Matsui Toshie、Irino Toshio、Uemura Ryo、Yamamoto Kodai、Kawahara Hideki、Patterson Roy D.
- Journal Title
  
  Speech Communication
  
  Volume: 136 Pages: 23～41
- DOI
  10.1016/j.specom.2021.10.006
- Peer Reviewed / Int'l Joint Research
[Journal Article] 模擬難聴技術とその応用2022
- Author(s)
  入野俊夫
- Journal Title
  
  日本音響学会誌
  
  Volume: 78 Pages: 718～723
- DOI
  10.20697/jasj.78.12_718
[Presentation] 基本周波数適応型聴覚表現による声道長推定2023
- Author(s)
  入野俊夫, 土庵晋太郎
- Organizer
  電子情報通信学会, 音声研究会
[Presentation] 客観評価指標 GESI による模擬難聴音声了解度の個人別予測2023
- Author(s)
  山本絢子, 宮﨑芙紀,田丸萌夏, 入野俊夫
- Organizer
  日本音響学会：春季研究発表会
[Presentation] クラウドソーシング聴取実験のための効果的な事前参加者スクリーニング2023
- Author(s)
  宮﨑芙紀, 山本絢子, 土庵晋太郎, 入野俊夫
- Organizer
  日本音響学会：春季研究発表会
[Presentation] 演技未経験者の感情音声の演技における台本の影響: 音響解析と主観評価による検討2023
- Author(s)
  坂下尚史, 河原英紀, 松井淑恵
- Organizer
  日本音響学会第149回（2023年春季）研究発表会
[Presentation] 日本語音声のモーフィングに対する性別判断: 心理測定関数による知覚特性の調査2023
- Author(s)
  菅野聖真, 河原英紀, 松井淑恵
- Organizer
  日本音響学会第149回（2023年春季）研究発表会
[Presentation] 音声モーフィングを用いた話者類似性判断と話者同定判断の調査: 発話単語の同異と鼻音の有無による影響2023
- Author(s)
  内堀颯太, 河原英紀, 松井淑恵
- Organizer
  日本音響学会第149回（2023年春季）研究発表会
[Presentation] 調波複合音の基本周波数の変調に対する発声の不随意応答: 階段状ピッチシフト実験との比較2023
- Author(s)
  廖嘉慧, 河原英紀, 松井淑恵
- Organizer
  日本音響学会第149回（2023年春季）研究発表会
[Presentation] Improving auditory filter estimation with level-dependent cochlear noise floor2022
- Author(s)
  Toshio Irino, Kenji Yokota, Roy D. Patterson
- Organizer
  International Symposium on Hearing (ISH) 2022
- Int'l Joint Research
[Presentation] Speech intelligibility of simulated hearing loss sounds and its prediction using the Gammachirp Envelope Similarity Index (GESI)2022
- Author(s)
  Toshio Irino, Honoka Tamaru, and Ayako Yamamoto
- Organizer
  Interspeech 2022
- Int'l Joint Research
[Presentation] Effective data screening technique for crowdsourced speech intelligibility experiments: Evaluation with IRM-based speech enhancement2022
- Author(s)
  Ayako Yamamoto, Toshio Irino, Shoko Araki, Kenichi Arai, Atsunori Ogawa, Keisuke Kinoshita, and Tomohiro Nakatani
- Organizer
  APSIPA ASC 2022
- Int'l Joint Research
[Presentation] Intelligibility Prediction of Enhanced Speech Using Recognition Accuracy of End-To-End ASR System2022
- Author(s)
  Kenichi Arai, Atsunori Ogawa, Shoko Araki, Keisuke Kinoshita, Tomohiro Nakatani, Naoyuki Kamo, and Toshio Irino
- Organizer
  APSIPA ASC 2022
- Int'l Joint Research
[Presentation] Speech Intelligibility Prediction Through Direct Estimation of Word Accuracy Using Conformer,2022
- Author(s)
  Naoyuki Kamo, Kenichi Arai, Atsunori Ogawa, Shoko Araki, Tomohiro Nakatani, Keisuke Kinoshita, Marc Delcroix, Tsubasa Ochiai and Toshio Irino
- Organizer
  APSIPA ASC 2022
- Int'l Joint Research
[Presentation] Conformer-based Fusion of Text, Audio, and Listener Characteristics for Predicting Speech Intelligibility of Hearing Aid Users2022
- Author(s)
  Naoyuki Kamo, Kenichi Arai, Atsunori Ogawa, Shoko Araki, Tomohiro Nakatani, Keisuke Kinoshita, Marc Delcroix, Tsubasa Ochiai, and Toshio Irino
- Organizer
  The 2nd Clarity Workshop on Machine Learning Challenges for Hearing Aids (Clarity-2022)
- Int'l Joint Research
[Presentation] ammachirp Envelope Similarity Index (GESI)による模擬難聴音声の了解度予測～防音室実験とクラウドソーシング遠隔実験の主観評価データを用いて～2022
- Author(s)
  入野俊夫, 田丸萌夏, 山本絢子
- Organizer
  音学シンポジウム2022
[Presentation] 客観評価指標GESIによる音声了解度予測 - 強調処理音声と音圧低減音声を対象として -2022
- Author(s)
  山本絢子, 入野俊夫, 荒木章子，田丸萌夏, 新井賢一，小川厚徳，木下慶介，中谷智広
- Organizer
  日本音響学会聴覚研究会
[Presentation] 高齢難聴者の音声了解度客観評価を目指したGESI の開発 - 強調音声と模擬難聴音声による評価 -2022
- Author(s)
  山本絢子, 入野俊夫, 荒木章子，田丸萌夏, 新井賢一，小川厚徳，木下慶介，中谷智広
- Organizer
  日本音響学会：秋季研究発表会
[Presentation] 拡声環境を想定した音声了解度指標GESIと従来手法との比較2022
- Author(s)
  渡邊健太郎，小林洋介，入野俊夫
- Organizer
  日本音響学会：秋季研究発表会
[Presentation] 模擬難聴音声了解度の主観評価実験とGESIによる予測2022
- Author(s)
  山本絢子, 宮﨑芙紀,田丸萌夏, 入野俊夫
- Organizer
  日本音響学会関西支部,第24回関西支部若手研究者交流研究発表会
[Presentation] クラウドソーシング聴取実験のための効果的な事前参加者スクリーニングの検討2022
- Author(s)
  宮﨑芙紀,山本絢子, 土庵晋太郎, 入野俊夫
- Organizer
  日本音響学会関西支部,第24回関西支部若手研究者交流研究発表会
[Presentation] 客観評価指標 GESI による模擬難聴音声の了解度予測 - 健聴者による原音声の主観評価値のみを用いて -2022
- Author(s)
  山本絢子, 宮﨑芙紀,田丸萌夏, 入野俊夫
- Organizer
  日本音響学会聴覚研究会
[Presentation] 演技未経験者の感情音声の演技発話における台本の影響2022
- Author(s)
  坂下尚史, 河原英紀, 松井淑恵
- Organizer
  日本音響学会2022年秋季研究発表会
[Presentation] 基本周波数の周波数変調に対する発声の不随意応答：刺激音の種類・変調量による影響2022
- Author(s)
  廖嘉慧, 河原英紀, 松井淑恵
- Organizer
  日本音響学会2022年秋季研究発表会
[Presentation] モーフィング音声を用いた話者の個人性知覚の調査: 鼻音の有無・発話文の同異による影響2022
- Author(s)
  内堀颯太, 河原英紀, 松井淑恵
- Organizer
  日本音響学会聴覚研究会
[Presentation] 基本周波数の周波数変調に対する発声の不随意応答：純音・複合音を用いた検討2022
- Author(s)
  廖嘉慧, 河原英紀, 松井淑恵
- Organizer
  報処理学会第134回音楽情報科学研究会（音学シンポジウム)
[Patent(Industrial Property Rights)] 音の評価指標計算方法、評価データを生成する方法、音の評価装置、及びコンピュータプログラム2022
- Inventor(s)
  入野俊夫
- Industrial Property Rights Holder
  和歌山大学
- Industrial Property Rights Type
  特許
- Industrial Property Number
  特願2022-092345

2022 Fiscal Year Annual Research Report

Foundation of speech communication support based on auditory perception models for everyone including elderly persons with hearing impairment

Principal Investigator

入野 俊夫 和歌山大学, システム工学部, 教授 (20346331)

Current Status of Research Progress

Reason

Research Products

[Int'l Joint Research] University of Cambridge(英国)

Country Name

Counterpart Institution

[Journal Article] Modelling speaker-size discrimination with voiced and unvoiced speech sounds based on the effect of spectral lift2022

Author(s)

Journal Title

DOI

[Journal Article] 模擬難聴技術とその応用2022

Author(s)

Journal Title

DOI

[Presentation] 基本周波数適応型聴覚表現による声道長推定2023

Author(s)

Organizer

[Presentation] 客観評価指標 GESI による 模擬難聴音声了解度の個人別予測2023

Author(s)

Organizer

[Presentation] クラウドソーシング聴取実験のための効果的な事前参加者スクリーニング2023

Author(s)

Organizer

[Presentation] 演技未経験者の感情音声の演技における台本の影響: 音響解析と主観評価による検討2023

Author(s)

Organizer

[Presentation] 日本語音声のモーフィングに対する性別判断: 心理測定関数による知覚特性の調査2023

Author(s)

Organizer

[Presentation] 音声モーフィングを用いた話者類似性判断と話者同定判断の調査: 発話単語の同異と鼻音の有無による影響2023

Author(s)

Organizer

[Presentation] 調波複合音の基本周波数の変調に対する発声の不随意応答: 階段状ピッチシフト実験との比較2023

Author(s)

Organizer

[Presentation] Improving auditory filter estimation with level-dependent cochlear noise floor2022

Author(s)

Organizer

[Presentation] Speech intelligibility of simulated hearing loss sounds and its prediction using the Gammachirp Envelope Similarity Index (GESI)2022

Author(s)

Organizer

[Presentation] Effective data screening technique for crowdsourced speech intelligibility experiments: Evaluation with IRM-based speech enhancement2022

Author(s)

Organizer

[Presentation] Intelligibility Prediction of Enhanced Speech Using Recognition Accuracy of End-To-End ASR System2022

Author(s)

Organizer

[Presentation] Speech Intelligibility Prediction Through Direct Estimation of Word Accuracy Using Conformer,2022

Author(s)

Organizer

[Presentation] Conformer-based Fusion of Text, Audio, and Listener Characteristics for Predicting Speech Intelligibility of Hearing Aid Users2022

Author(s)

Organizer

[Presentation] ammachirp Envelope Similarity Index (GESI)による模擬難聴音声の了解度予測 ～ 防音室実験とクラウドソーシング遠隔実験の主観評価データを用いて ～2022

Author(s)

Organizer

[Presentation] 客観評価指標GESIによる音声了解度予測 - 強調処理音声と音圧低減音声を対象として -2022

Author(s)

Organizer

[Presentation] 高齢難聴者の音声了解度客観評価を目指したGESI の開発 - 強調音声と模擬難聴音声による評価 -2022

Author(s)

Organizer

[Presentation] 拡声環境を想定した音声了解度指標GESIと従来手法との比較2022

Author(s)

Organizer

[Presentation] 模擬難聴音声了解度の主観評価実験とGESIによる予測2022

Author(s)

Organizer

[Presentation] クラウドソーシング聴取実験のための効果的な事前参加者スクリーニングの検討2022

Author(s)

Organizer

[Presentation] 客観評価指標 GESI による模擬難聴音声の了解度予測 - 健聴者による原音声の主観評価値のみを用いて -2022

Author(s)

Organizer

[Presentation] 演技未経験者の感情音声の演技発話における台本の影響2022

Author(s)

入野俊夫和歌山大学, システム工学部, 教授 (20346331)

[Presentation] 客観評価指標 GESI による模擬難聴音声了解度の個人別予測2023

[Presentation] ammachirp Envelope Similarity Index (GESI)による模擬難聴音声の了解度予測～防音室実験とクラウドソーシング遠隔実験の主観評価データを用いて～2022