構音障がい者のカスタマイズドコミュニケーション基盤技術の創出

研究課題

研究課題/領域番号	23K20733
補助金の研究課題番号	21H00906 (2021-2023)
研究種目	基盤研究(B)
配分区分	基金 (2024) 補助金 (2021-2023)
応募区分	一般
審査区分	小区分09070:教育工学関連
研究機関	神戸大学
研究代表者	滝口哲也神戸大学, 都市安全研究センター, 教授 (40397815)
研究分担者	中井靖京都女子大学, 心理共生学部, 教授 (80462050) HASCOET TRISTAN 神戸大学, 経営学研究科, 助教 (60848448)
研究期間 (年度)	2021-04-01 – 2025-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	16,380千円 (直接経費: 12,600千円、間接経費: 3,780千円) 2024年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円) 2023年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2022年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円) 2021年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
キーワード	ヒューマン・インターフェース / 発話コミュニケーション支援技術
研究開始時の研究の概要	本研究では，発話が不明瞭であり自分の意思を声にして伝えることが困難な構音障がい者を対象に，発話認識・音声変換手法の研究を行う．構音障がい者への身体負担を考慮すると，事前に大量教師（発話テキスト）あり発話音声データを集めることは難しいため，発話テキスト情報を使わない自己教師あり学習を利用した音響モデル構築手法などを提案し，コミュニケーション支援技術の有効性を示す．
研究実績の概要	昨年度の研究成果をもとに構音障がい者のカスタマイズドコミュニケーション基盤技術に資する手法の提案，および実証実験をさまざまな観点から行い，それらの有効性を確認した．主な内容は以下のとおりである．器質性構音障がい者のテキストなし音声を用いた自己教師あり学習による音声認識について検討した．事前に大規模な健常者音声を用いて自己教師あり学習を行い，次にその学習済みモデルを初期値として，器質性構音障がい者のテキストなし音声を用いて自己教師あり学習フェーズにおけるfine-tuningを行った．器質性構音障がい者のテキストなし音声で自己教師あり学習を行った場合は，行わない場合と比べて音声認識率が改善されることが示された．また音声変換においては（主に以下の3つの課題について検討），実応用面でのリアルタイム処理を実現するため，End-to-End系列変換型声質変換への高速ニューラル波形生成モデルの導入を検討し，高品質な音質を維持したまま高速化が可能であることを確認した．また音声変換において入力話者と出力話者における音素継続長の違いや，同じ音が全く別の音のように発音されるといった問題が発生し，音声変換精度に影響を与えている．この問題の一つの対応策として柔軟なアライメントを生成可能な方法も検討し，声質変換において有効性を確認した．また言葉の繰り返しや発話が困難な場合がある吃音当事者のコミュニケーション支援として，吃音者本人の声質でかつ流暢な音声を合成可能な音声合成システムも検討した．吃音当事者の発話においては，難発に伴い（本来無いはずの）無音声区間が長く生じることがある．この難発の影響を軽減するために，健常者の音素継続長を用いて音声合成システムの学習をする方法を提案し，有効性を確認した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由交付申請書では，2つのサブテーマを設定していた. (1) 構音障がいとして器質性構音障がいに着目し，利用可能な学習用の発話データ数が少ないという問題に対し，器質性構音障がい者のテキストなし音声を用いて自己教師あり学習法を適用し，行わない場合と比べて音声認識率が改善されることを示すことができた．また昨年度に引き続き，構音障がい者の音声認識に追加して，マルチモーダルな感情発話認識/字幕生成，対話システムなどについても論文発表を行うことができた． (2) 音声変換においては，実用性に着目するため，高品質かつハイエンドなGPUを必要とせずCPUのみでもリアルタイム生成可能なニューラル音声波形生成モデルを構築し，その有効性を示すことができた．さらに，歌声音声変換や合成音声の品質に影響を与えるニューラルボコーダなどについても論文発表を行うことができた．ジャーナル1件，学会発表21件(うち査読あり国際会議予稿集2件)の発表を行い，本申請課題は，おおむね順調に進展しているといえる．
今後の研究の推進方策	本年度の研究成果をもとに研究をさらに遂行していく．これまでの研究成果により音声合成の声質も改善されてきているので，音声合成を活用した音声認識のデータ拡張も再度検討していく．音声変換においては，引き続き入力音声（聞き取り困難な音声）と出力音声（聞き取り容易な音声）のミスマッチ課題について，新たなニューラルネットワーク構造を検討していく．また音声認識，音声変換・合成の研究において，引き続き構音障がい者の音声データ収録を行い，提案手法の有効性を示していく． - 研究代表者・研究分担者・協力者の間で，定期的に報告会を開催し，研究の進捗状況を協議する． - 地域障がい者NPO法人の方々とも定期的に話し合いを行い，研究の有効性に関する調査を継続する．

報告書

(3件)

研究成果
(67件)

すべて 2024 2023 2022 2021 その他

すべて雑誌論文 (8件) (うち国際共著 3件、査読あり 8件、オープンアクセス 5件) 学会発表 (58件) (うち国際学会 9件) 備考 (1件)

[雑誌論文] Fast Neural Speech Waveform Generative Models With Fully-Connected Layer-Based Upsampling2024
- 著者名/発表者名
  Haruki Yamashita, Takuma Okamoto, Ryoichi Takashima, Yamato Ohtani, Tetsuya Takiguchi, Tomoki Toda, Hisashi Kawai
- 雑誌名
  
  IEEE Access
  
  巻: 12 ページ: 31409-31421
- DOI
  10.1109/access.2024.3366707
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Convolutional Neural Networks Inference Memory Optimization with Receptive Field-Based Input Tiling2023
- 著者名/発表者名
  Weihao Zhuang, Tristan Hascoet, Xunquan Chen, Ryoichi Takashima , Tetsuya Takiguchi , Yasuo Ariki
- 雑誌名
  
  APSIPA Transactions on Signal and Information Processing
  
  巻: 12 号: 1 ページ: 1-20
- DOI
  10.1561/116.00000015
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Reversible designs for extreme memory cost reduction of CNN training2023
- 著者名/発表者名
  Tristan Hascoet, Quentin Febvre, Weihao Zhuang, Yasuo Ariki and Tetsuya Takiguchi
- 雑誌名
  
  EURASIP Journal on Image and Video Processing
  
  巻: - 号: 1 ページ: 1-30
- DOI
  10.1186/s13640-022-00601-w
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Speaker-Independent Emotional Voice Conversion via Disentangled Representations2023
- 著者名/発表者名
  Chen Xunquan、Xu Xuexin、Chen Jinhui、Zhang Zhizhong、Takiguchi Tetsuya、Hancock Edwin R.
- 雑誌名
  
  IEEE Transactions on Multimedia
  
  巻: - ページ: 1-14
- DOI
  10.1109/tmm.2022.3222646
- 関連する報告書
  2022 実績報告書
- 査読あり / 国際共著
[雑誌論文] 対話穴埋め：検索・生成ベース雑談対話システムの発話制御手法2022
- 著者名/発表者名
  薛強, 滝口哲也, 有木康雄
- 雑誌名
  
  人工知能学会論文誌
  
  巻: 37 号: 3 ページ: IDS-C_1-9
- DOI
  10.1527/tjsai.37-3_IDS-C
- ISSN
  1346-0714, 1346-8030
- 年月日
  2022-05-01
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Phoneme-guided Dysarthric Speech Conversion With Non-parallel Data by Joint Training2022
- 著者名/発表者名
  Xunquan Chen, Atsuki Oshiro, Jinhui Chen, Ryoichi Takashima, Tetsuya Takiguchi
- 雑誌名
  
  Signal, Image and Video Processing
  
  巻: ー号: 6 ページ: 1-8
- DOI
  10.1007/s11760-021-02119-6
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Unsupervised domain adaptation for lip reading based on cross-modal knowledge distillation2021
- 著者名/発表者名
  Yuki Takashima, Ryoichi Takashima, Ryota Tsunoda, Ryo Aihara, Tetsuya Takiguchi, Yasuo Ariki, and Nobuaki Motoyama
- 雑誌名
  
  EURASIP Journal on Audio, Speech, and Music Processing
  
  巻: 2021 号: 1 ページ: 1-9
- DOI
  10.1186/s13636-021-00232-5
- NAID
  120007179191
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Full-Band LPCNet: A Real-Time Neural Vocoder for 48 kHz Audio With a CPU2021
- 著者名/発表者名
  Keisuke Matsubara, Takuma Okamoto, Ryoichi Takashima, Tetsuya Takiguchi, Tomoki Toda, Yoshinori Shiga, Hisashi Kawai
- 雑誌名
  
  IEEE Access
  
  巻: 9 ページ: 94923-94933
- DOI
  10.1109/access.2021.3089565
- 関連する報告書
  2021 実績報告書
- 査読あり
[学会発表] ラベルなし音声を用いた自己教師あり学習による器質性構音障害者の音声認識2024
- 著者名/発表者名
  北条直樹, 高島遼一, 杉山千尋, 田中信和, 野原幹司, 野崎一徳, 滝口哲也
- 学会等名
  電子情報通信学会総合大会, ISS-SP-040, p. 135
- 関連する報告書
  2023 実績報告書
[学会発表] JudgerToken: A Single-Token Method for Reducing Repetition in Dialogue System2024
- 著者名/発表者名
  Qiang Xue, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  Proceedings of the 14th International Workshop on Spoken Dialogue Systems Technology
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 正弦波入力型ニューラルボコーダを用いたTTSモデルによる歌声合成2024
- 著者名/発表者名
  清水聡太, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2024年春季研究発表会講演論文集, 1-2-10, pp. 785-788
- 関連する報告書
  2023 実績報告書
[学会発表] EdenVC : 音素継続長とアライメントの協調学習を用いた系列長変換型声質変換モデル2024
- 著者名/発表者名
  山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2024年春季研究発表会講演論文集, 1-2-12, pp. 793-796
- 関連する報告書
  2023 実績報告書
[学会発表] 吃音者向けTTSシステムのための健常者音素継続長を反映したVITSの学習手法の提案2024
- 著者名/発表者名
  長久保諒, 山下陽生, 高島遼一, 安井美鈴, 滝口哲也
- 学会等名
  日本音響学会2024年春季研究発表会講演論文集, 1-Q-34, pp. 919-922
- 関連する報告書
  2023 実績報告書
[学会発表] 日本語フォント文字の印象評価と感情字幕生成への応用2024
- 著者名/発表者名
  中村史也, 相原龍, 高島遼一, 滝口哲也, 伊谷裕介
- 学会等名
  日本音響学会2024年春季研究発表会講演論文集, 2-P-14, pp. 983-986
- 関連する報告書
  2023 実績報告書
[学会発表] 歌声合成と変換を用いた未経験者音声からのオペラ歌唱音声合成2024
- 著者名/発表者名
  菅原碧斗, 岸本宗真, 足立優司, 田井清登, 高島遼一, 滝口哲也
- 学会等名
  日本音響学会2024年春季研究発表会講演論文集, 2-P-29, pp. 1031-1034
- 関連する報告書
  2023 実績報告書
[学会発表] 知識グラフの対話システムへの記憶化：学習アプローチの探究2024
- 著者名/発表者名
  薛強, 滝口哲也, 有木康雄
- 学会等名
  言語処理学会第30回年次大会発表論文集, pp. 1453-1457
- 関連する報告書
  2023 実績報告書
[学会発表] 知識グラフに基づくルールベースよるFact Verificationとその拡張手法の考察2024
- 著者名/発表者名
  籾井裕貴, 滝口哲也, 有木康雄
- 学会等名
  言語処理学会第30回年次大会発表論文集, pp. 2976-2981
- 関連する報告書
  2023 実績報告書
[学会発表] Rule-based Fact Verification Utilizing Knowledge Graphs2023
- 著者名/発表者名
  Y. Momii, T. Takiguchi, and Y. Ariki
- 学会等名
  The 12th International Joint Conference on Knowledge Graphs
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 対話データに基づく重複文負例の作成と重複を抑制する言語モデルの提案2023
- 著者名/発表者名
  薛強, 滝口哲也, 有木康雄
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会, pp. 19-24
- 関連する報告書
  2023 実績報告書
[学会発表] 知識グラフを活用したルールベースによるFact Verification2023
- 著者名/発表者名
  籾井裕貴, 滝口哲也, 有木康雄
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会, pp. 51-55
- 関連する報告書
  2023 実績報告書
[学会発表] 発話困難者の音声コミュニケーションを支援する音声認識技術2023
- 著者名/発表者名
  滝口哲也, 北条直樹, 高島遼一, 杉山千尋, 田中信和, 野原幹司, 野崎一徳
- 学会等名
  日本医療情報学会第43回医療情報学連合大会
- 関連する報告書
  2023 実績報告書
[学会発表] F0予測・波形生成ネットワークの一貫学習によるメルスペクトログラム入力型F0制御可能ニューラルボコーダ2023
- 著者名/発表者名
  清水聡太, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2023年秋季研究発表会講演論文集, 1-9-6, pp. 1041-1044
- 関連する報告書
  2023 実績報告書
[学会発表] Diff-SVCを用いたオペラ歌唱音声合成における中高域強調ネットワークの検討2023
- 著者名/発表者名
  菅原碧斗, 岸本宗真, 足立優司, 田井清登, 高島遼一, 滝口哲也
- 学会等名
  日本音響学会2023年秋季研究発表会講演論文集, 2-Q-43, pp. 1283-1286
- 関連する報告書
  2023 実績報告書
[学会発表] End-to-End 系列変換型声質変換への高速ニューラル波形生成モデル導入の検討2023
- 著者名/発表者名
  山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2023年秋季研究発表会講演論文集, 2-Q-47, pp. 1295-1298
- 関連する報告書
  2023 実績報告書
[学会発表] 単語埋め込み表現を用いた感情音声からの字幕画像生成手法の検討2023
- 著者名/発表者名
  中村史也, 相原龍, 高島遼一, 滝口哲也, 伊谷裕介
- 学会等名
  日本音響学会2023年秋季研究発表会講演論文集, 3-Q-10, pp. 1333-1336
- 関連する報告書
  2023 実績報告書
[学会発表] MS-Harmonic-Net++ vs SiFi-GAN: 基本周波数制御可能な高速ニューラル波形生成モデルの比較2023
- 著者名/発表者名
  清水聡太, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  電子情報通信学会技術研究報告, Vol. 123, No. 88, SP2023-5, pp. 20-25
- 関連する報告書
  2023 実績報告書
[学会発表] Diff-SVCを用いたオペラ歌唱音声合成2023
- 著者名/発表者名
  菅原碧斗, 岸本宗真, 足立優司, 田井清登, 高島遼一, 滝口哲也
- 学会等名
  電子情報通信学会技術研究報告, Vol. 123, No. 88, SP2023-7, pp. 30-35
- 関連する報告書
  2023 実績報告書
[学会発表] 発話音声の感情情報に基づく色つき字幕画像生成の検討2023
- 著者名/発表者名
  中村史也, 相原龍, 高島遼一, 滝口哲也, 伊谷裕介
- 学会等名
  電子情報通信学会技術研究報告, Vol. 123, No. 88, SP2023-11, pp. 54-59
- 関連する報告書
  2023 実績報告書
[学会発表] 全結合層型アップサンプリングを導入した高速ニューラル波形生成モデル2023
- 著者名/発表者名
  山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  電子情報通信学会技術研究報告, Vol. 123, No. 88, SP2023-15, pp. 73-78
- 関連する報告書
  2023 実績報告書
[学会発表] Visual Archive Search Using Vision-language Object Detection Models2023
- 著者名/発表者名
  Ryuichi Tomiya, Tristan Hascoet, Ryoichi Takashima, Tetsuya Takiguchi
- 学会等名
  International Workshop on Nonlinear Circuits, Communications and Signal Processing
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] 器質性構音障害者音声認識のための簡易ラベルによる中間層ロスの導入2023
- 著者名/発表者名
  冨士原健斗, 高島遼一, 杉山千尋, 田中信和, 野原幹司, 野崎一徳, 滝口哲也
- 学会等名
  日本音響学会2023年春季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 脊髄性筋萎縮症者音声合成における明瞭性および話者性を考慮した適応手法の検討2023
- 著者名/発表者名
  吉本拓真, 高島遼一, 佐々木千穂, 滝口哲也
- 学会等名
  日本音響学会2023年春季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] Emotional Voice Conversion with a Novel Content-Style Fusion Block2023
- 著者名/発表者名
  陳訓泉, 陳金輝, 高島遼一, 滝口哲也
- 学会等名
  日本音響学会2023年春季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] Towards Expressive Speech Conversion based on StarGANv22023
- 著者名/発表者名
  牟尚泱, 陳金輝, 高島遼一, 滝口哲也
- 学会等名
  日本音響学会2023年春季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] End-to-End系列変換型声質変換の高速化およびノンネイティブ話者変換の検討2023
- 著者名/発表者名
  山下陽生, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2023年春季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] Harmonic-Net++: 基本周波数制御可能なメルスペクトログラム入力型高速ニューラルボコーダ2023
- 著者名/発表者名
  清水聡太, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2023年春季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 発話音声の感情を反映したテロップ画像の自動生成手法の検討2023
- 著者名/発表者名
  中村史也, 相原龍, 高島遼一, 滝口哲也, 今井良枝
- 学会等名
  日本音響学会2023年春季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 発話音声を用いたオペラ歌唱音声合成の初期検討2023
- 著者名/発表者名
  菅原碧斗, 岸本宗真, 足立優司, 田井清登, 高島遼一, 滝口哲也
- 学会等名
  日本音響学会2023年春季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 生成・分類言語モデルに基づく対話システムの構築2023
- 著者名/発表者名
  薛強, 滝口哲也, 有木康雄
- 学会等名
  言語処理学会第29回年次大会発表論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 知識グラフに基づく応答文生成における記号化されたエンティティの利用2023
- 著者名/発表者名
  籾井裕貴, 滝口哲也, 有木康雄
- 学会等名
  言語処理学会第29回年次大会発表論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 基本周波数制御可能な高速ニューラル波形生成モデルの比較2023
- 著者名/発表者名
  清水聡太, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  電子情報通信学会技術研究報告
- 関連する報告書
  2022 実績報告書
[学会発表] Multi-stream FC-HiFi-GAN:学習可能な軽量アップサンプリングを用いた高速ニューラル波形生成モデル2023
- 著者名/発表者名
  山下陽生, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  電子情報通信学会技術研究報告
- 関連する報告書
  2022 実績報告書
[学会発表] Highly Intelligible Speech Synthesis for Spinal Muscular Atrophy Patients Based on Model Adaptation2022
- 著者名/発表者名
  Takuma Yoshimoto, Ryoichi Takashima, Chiho Sasaki, Tetsuya Takiguchi
- 学会等名
  Speech for Social Good Workshop
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Building a Knowledge-Based Dialogue System with Text Infilling2022
- 著者名/発表者名
  Qiang Xue, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  Proceedings of the 23rd Annual Meeting of the Special Interest Group on Discourse and Dialogue
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Speaker-Targeted Audio-Visual Speech Recognition Using a Hybrid CTC/Attention Model with Interference Loss2022
- 著者名/発表者名
  Ryota Tsunoda, Ryo Aihara, Ryoichi Takashima, Tetsuya Takiguchi, Yoshie Imai
- 学会等名
  IEEE ICASSP
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] FC-HiFi-GAN:全結合層型アップサンプリングを導入した高速 HiFi-GAN2022
- 著者名/発表者名
  山下陽生, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2022年秋季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] Harmonic-Net+:高調波入力とLayerwise-Quasi-Periodic畳み込みを用いた基本周波数制御可能な高速ニューラルボコーダ2022
- 著者名/発表者名
  松原圭亮, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2022年秋季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 基本周波数制御可能なメルスペクトログラム入力型HiFi-GANの初期検討2022
- 著者名/発表者名
  清水聡太, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2022年秋季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 構音障害者のための高明瞭度音声合成におけるHiFi-GANを用いた品質改善2022
- 著者名/発表者名
  松原圭亮, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2022年秋季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] Towards Natural Emotional Voice Conversion with Novel Attention Module2022
- 著者名/発表者名
  陳訓泉, 陳金輝, 高島遼一, 滝口哲也
- 学会等名
  日本音響学会2022年秋季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 器質性構音障害者向け音声認識モデルにおける発話辞書適応方式の比較検討2022
- 著者名/発表者名
  冨士原健斗, 高島遼一, 杉山千尋, 田中信和, 野原幹司, 野崎一徳, 滝口哲也
- 学会等名
  日本音響学会2022年秋季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] wav2vec 2.0 によるラベル無し音声を用いた脳性麻痺患者の音声認識2022
- 著者名/発表者名
  松坂勇樹, 高島遼一, 滝口哲也
- 学会等名
  日本音響学会2022年秋季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 筋萎縮性側索硬化症者の音声合成を目的としたモデル適応と声質変換の比較評価2022
- 著者名/発表者名
  吉本拓真, 高島遼一, 佐々木千穂, 滝口哲也
- 学会等名
  日本音響学会2022年秋季研究発表会講演論文集
- 関連する報告書
  2022 実績報告書
[学会発表] 三題噺生成：指定知識による対話システムの応答生成手法2022
- 著者名/発表者名
  薛強, 滝口哲也, 有木康雄
- 学会等名
  人工知能学会全国大会論文集
- 関連する報告書
  2022 実績報告書
[学会発表] Comparative Evaluation of Neural Vocoders for Speech Synthesis of Operatic Singing2022
- 著者名/発表者名
  Sota Shimizu, Keisuke Matsubara, Yuji Adachi, Kiyoto Tai, Ryoichi Takashima, Tetsuya Takiguchi
- 学会等名
  IEEE LifeTech
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Adaptation of a Pronunciation Dictionary for Dysarthric Speech Recognition2022
- 著者名/発表者名
  Yuya Sawa, Ryoichi Takashima, Tetsuya Takiguchi
- 学会等名
  IEEE LifeTech
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] 構音障害者音声認識における自己教師あり学習と疑似ラベリングの動的重み付きマルチタスク学習2022
- 著者名/発表者名
  澤佑哉, 相原龍, 高島遼一, 滝口哲也, 今井良枝
- 学会等名
  日本音響学会2022年春季研究発表会講演論文集
- 関連する報告書
  2021 実績報告書
[学会発表] Emotional Voice Conversion Using Disentangled Representation Learning and Attention Mechanism2022
- 著者名/発表者名
  陳訓泉, 陳金輝, 高島遼一, 滝口哲也
- 学会等名
  日本音響学会2022年春季研究発表会講演論文集
- 関連する報告書
  2021 実績報告書
[学会発表] オペラ歌唱音声合成におけるニューラルボコーダの比較検討2022
- 著者名/発表者名
  清水聡太, 松原圭亮, 足立優司, 田井清登, 高島遼一, 滝口哲也
- 学会等名
  日本音響学会2022年春季研究発表会講演論文集
- 関連する報告書
  2021 実績報告書
[学会発表] 知識グラフに基づく応答文生成におけるエンティティ名制約付きデコーディング2022
- 著者名/発表者名
  佐良和孝, 滝口哲也, 有木康雄
- 学会等名
  言語処理学会第28回年次大会発表論文集
- 関連する報告書
  2021 実績報告書
[学会発表] テキスト穴埋めによる知識ベース対話システムの構築2022
- 著者名/発表者名
  薛強, 滝口哲也, 有木康雄
- 学会等名
  言語処理学会第28回年次大会発表論文集
- 関連する報告書
  2021 実績報告書
[学会発表] Data Augmentation Based on Frequency Warping for Recognition of Cleft Palate Speech2021
- 著者名/発表者名
  Kento Fujiwara, Ryoichi Takashima, Chihiro Sugiyama, Nobukazu Tanaka, Kanji Nohara, Kazunori Nozaki, Tetsuya Takiguchi
- 学会等名
  APSIPA
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Emotional Voice Conversion by Learning Disentangled Representations with Spectrum and Prosody Features2021
- 著者名/発表者名
  陳訓泉，陳金輝，高島遼一，滝口哲也
- 学会等名
  日本音響学会2021年秋季研究発表会講演論文集
- 関連する報告書
  2021 実績報告書
[学会発表] 擬似ラベリングと特徴表現学習を併用した構音障害者音声認識2021
- 著者名/発表者名
  澤佑哉，冨士原健斗，相原龍，高島遼一，滝口哲也，今井良枝
- 学会等名
  日本音響学会2021年秋季研究発表会講演論文集
- 関連する報告書
  2021 実績報告書
[学会発表] HiFi-GANボコーダにおけるLPCNet特徴量の検討2021
- 著者名/発表者名
  松原圭亮, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒
- 学会等名
  日本音響学会2021年秋季研究発表会講演論文集
- 関連する報告書
  2021 実績報告書
[学会発表] 誤り訂正に基づく器質性構音障害者の音声認識精度向上の検討2021
- 著者名/発表者名
  冨士原健斗，高島遼一，杉山千尋，田中信和，野原幹司，野崎一徳，滝口哲也
- 学会等名
  日本音響学会2021年秋季研究発表会講演論文集
- 関連する報告書
  2021 実績報告書
[備考] 個人ホームページ
- URL
  http://www.me.cs.scitec.kobe-u.ac.jp/~takigu
- 関連する報告書
  2023 実績報告書 2022 実績報告書 2021 実績報告書

構音障がい者のカスタマイズドコミュニケーション基盤技術の創出

研究代表者

滝口 哲也 神戸大学, 都市安全研究センター, 教授 (40397815)

16,380千円 (直接経費: 12,600千円、間接経費: 3,780千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Fast Neural Speech Waveform Generative Models With Fully-Connected Layer-Based Upsampling2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Convolutional Neural Networks Inference Memory Optimization with Receptive Field-Based Input Tiling2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Reversible designs for extreme memory cost reduction of CNN training2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Speaker-Independent Emotional Voice Conversion via Disentangled Representations2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] 対話穴埋め：検索・生成ベース雑談対話システムの発話制御手法2022

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] Phoneme-guided Dysarthric Speech Conversion With Non-parallel Data by Joint Training2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Unsupervised domain adaptation for lip reading based on cross-modal knowledge distillation2021

著者名/発表者名

雑誌名

DOI

NAID

関連する報告書

[雑誌論文] Full-Band LPCNet: A Real-Time Neural Vocoder for 48 kHz Audio With a CPU2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] ラベルなし音声を用いた自己教師あり学習による器質性構音障害者の音声認識2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] JudgerToken: A Single-Token Method for Reducing Repetition in Dialogue System2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 正弦波入力型ニューラルボコーダを用いたTTSモデルによる歌声合成2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] EdenVC : 音素継続長とアライメントの協調学習を用いた系列長変換型声質変換モデル2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 吃音者向けTTSシステムのための健常者音素継続長を反映したVITSの学習手法の提案2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 日本語フォント文字の印象評価と感情字幕生成への応用2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 歌声合成と変換を用いた未経験者音声からのオペラ歌唱音声合成2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 知識グラフの対話システムへの記憶化：学習アプローチの探究2024

滝口哲也神戸大学, 都市安全研究センター, 教授 (40397815)