多元自動通訳システムと評価法に関する研究とその応用展開

研究課題

研究課題/領域番号	21H05054
研究種目	基盤研究(S)
配分区分	補助金
審査区分	大区分J
研究機関	奈良先端科学技術大学院大学
研究代表者	中村哲奈良先端科学技術大学院大学, 研究推進機構, 特任教授 (30263429)
研究分担者	河原達也京都大学, 情報学研究科, 教授 (00234104) 戸田智基名古屋大学, 情報基盤センター, 教授 (90403328) 森島繁生早稲田大学, 理工学術院, 教授 (10200411) 猿渡洋東京大学, 大学院情報理工学系研究科, 教授 (30324974) 松下佳世立教大学, 異文化コミュニケーション学部, 教授 (90746679) 高道慎之介慶應義塾大学, 理工学部(矢上), 准教授 (90784330) 須藤克仁奈良女子大学, 生活環境科学系, 教授 (00396152) SAKTI Sakriani 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (00395005) 渡辺太郎奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (90395038) 山田優立教大学, 異文化コミュニケーション学部, 教授 (70645001) 田中宏季奈良先端科学技術大学院大学, 先端科学技術研究科, 助教 (10757834) 品川政太朗奈良先端科学技術大学院大学, 先端科学技術研究科, 客員助教 (70897454)
研究期間 (年度)	2021-07-05 – 2026-03-31
研究課題ステータス	交付 (2025年度)
配分額 *注記	189,280千円 (直接経費: 145,600千円、間接経費: 43,680千円) 2025年度: 36,790千円 (直接経費: 28,300千円、間接経費: 8,490千円) 2024年度: 36,790千円 (直接経費: 28,300千円、間接経費: 8,490千円) 2023年度: 36,790千円 (直接経費: 28,300千円、間接経費: 8,490千円) 2022年度: 36,790千円 (直接経費: 28,300千円、間接経費: 8,490千円) 2021年度: 42,120千円 (直接経費: 32,400千円、間接経費: 9,720千円)
キーワード	音声翻訳
研究開始時の研究の概要	本研究では，課題１：多元同時通訳方式：パラ言語音声翻訳およびビデオ・事前・外部知識の利用による多元同時通訳，通訳出力最適化，漸進的音声通訳方式高度化，課題２：通訳品質の評価法とリアルタイム評価技術：通訳プロセス分析，通訳者支援技術，通訳者・自動通訳システム共通の通訳品質の評価法，脳活動を含むセンシングによる通訳品質客観的自動評価法の確立．課題３：コーパス構築とシステム：通訳時間アライメント・品質アノテーション，コーパス増強，実運用システムの構築とデータ収集・改良のエコシステムの構築とアクティブラーニング，ライフロングラーニング法の確立を実施する
研究実績の概要	【課題１】多元同時通訳方式：A)「強調」に関しては，フォーカスに関して，音声の韻律と言語表現の最適組み合わせ出力に取り組んだ．パラ言語情報制御機能を備えた音声変換・合成技術に関する基礎検討を行った．また，豊かな音声表情翻訳手法については発話者の韻律同期もしくは感情表出時の顔動画の個性表現に関して検討を進め，動画生成時のキーフレーム補間時のアイデンティティ同期の方法について検討を進めた．B)字幕翻訳を例に，分野やキャラクタ等の情報を明確に与える形での事前適応を試みた．C) 通訳出力最適化については，Local Agreement法とAlignAtt法による通訳方略の検討および音声合成の言語処理部の逐次動作化を進めた．【課題２】通訳品質の評価法とリアルタイム評価技術に関しては，A)「順送り」や「省略」などの分析をさらに進めた．また進的翻訳技術との連携により応用技術に落とし込み，通訳者の補助として有用な技術の切り出しの検討も進めた．B)通訳者が重視する観点の考慮，順送り訳の度合いの考慮などを含んだ自動通訳品質評価指標の検討を進めた．C)EEGを用いた認知負荷の高い構文の解析，文中の語順の異なる位置と認知負荷の関係，認知負荷を位相振幅カップリング（PAC）で分析する研究が進んだ．【課題３】コーパス構築とシステムとしては，A)自動アライメントによる通訳対訳コーパスの増強と同時通訳システムへの活用，また，通訳品質評価への応用について検討した．B)多元パラ言語アノテーション付きコーパス50時間，事前情報50時間については方針の検討を行った．C)モジュールの統合，評価を行い，エコシステムの設計，実装については引き続きIWSLTの評価タスクに参加してシステムの性能改善を進める。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 IWSLT評価タスクを目指した同時通訳システム試作とそれに伴う各モジュールの研究開発が順調に進んでいる。2022年度は、漸進的な音声認識、機械翻訳、音声合成を接続してシステムを構築したが、2023年度は多言語の事前学習モデル（音声モデル、翻訳モデル）をベースに改良を行い、入力言語の音声から直接対象言語のテキストへ変換し、それを逐次音声合成するシステムを構築した。評価についても、通訳者、同時通訳システムにおいて適用可能な自動評価システムができつつある。
今後の研究の推進方策	IWSLTの評価タスクに参加継続し、システムの高速化、性能改善を進めるとともに、研究用プロトタイプをさらに発展させて、実証実験可能なシステムを構築する。同時に、フォーカス、声質、発話表情を中心としたマルチモーダル翻訳システムと通訳の自動品質評価法を確立する。
評価記号	中間評価所見 (区分) A: 研究領域の設定目的に照らして、期待どおりの進展が認められる

報告書

(7件)

2023 研究概要(中間評価) ( PDF ) 実績報告書中間評価(所見) ( PDF )
2022 実績報告書
2021 研究概要(採択時) ( PDF ) 審査結果の所見 ( PDF ) 実績報告書

研究成果
(162件)

すべて 2024 2023 2022 2021

すべて雑誌論文 (26件) (うち国際共著 3件、査読あり 25件、オープンアクセス 22件) 学会発表 (134件) (うち国際学会 79件、招待講演 5件) 図書 (1件) 産業財産権 (1件)

[雑誌論文] Emotion-controllable Speech Synthesis using Emotion Soft Label, Utterance-level Prosodic Factors, and Word-level Prominence2024
- 著者名/発表者名
  Xuan Luo, Shinnosuke Takamichi, Yuki Saito, Tomoki Koriyama, Hiroshi Saruwatari
- 雑誌名
  
  APSIPA Transactions on Signal and Information Processing
  
  巻: 13 号: 1 ページ: 1-30
- DOI
  10.1561/116.00000242
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Text-Inductive Graphone-Based Language Adaptation for Low-Resource Speech Synthesis2024
- 著者名/発表者名
  Saeki Takaaki、Maiti Soumi、Li Xinjian、Watanabe Shinji、Takamichi Shinnosuke、Saruwatari Hiroshi
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 32 ページ: 1829-1844
- DOI
  10.1109/taslp.2024.3369537
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Improving Speech Translation Accuracy and Time Efficiency With Fine-Tuned wav2vec 2.0-Based Speech Segmentation2024
- 著者名/発表者名
  Fukuda Ryo、Sudoh Katsuhito、Nakamura Satoshi
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 32 ページ: 906-916
- DOI
  10.1109/taslp.2023.3343614
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Prefix Alignment for Training Simultaneous Machine Translation2024
- 著者名/発表者名
  Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
- 雑誌名
  
  自然言語処理
  
  巻: 31 号: 1 ページ: 79-104
- DOI
  10.5715/jnlp.31.79
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Sound Field Interpolation for Rotation-Invariant Multichannel Array Signal Processing2023
- 著者名/発表者名
  Wakabayashi Yukoh、Yamaoka Kouei、Ono Nobutaka
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 31 ページ: 2286-2298
- DOI
  10.1109/taslp.2023.3282098
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] PoP-IDLMA: Product-of-Prior Independent Deeply Learned Matrix Analysis for Multichannel Music Source Separation2023
- 著者名/発表者名
  Takuya Hasumi, Tomohiko Nakamura, Norihiro Takamune, Hiroshi Saruwatari, Daichi Kitamura, Yu Takahashi, and Kazunobu Kondo
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 31 ページ: 2680-2694
- DOI
  10.1109/taslp.2023.3293044
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Content Order-Controllable MR-to-Text2023
- 著者名/発表者名
  Keisuke Toyama, Katsuhito Sudoh, Satoshi Nakamura
- 雑誌名
  
  IEEE Access
  
  巻: 11 ページ: 129353-129365
- DOI
  10.1109/access.2023.3334139
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] 国会会議録のための音声から書き言葉への end-to-end 変換2023
- 著者名/発表者名
  Mimura Masato、Kawahara Tatsuya
- 雑誌名
  
  自然言語処理
  
  巻: 30 号: 1 ページ: 88-124
- DOI
  10.5715/jnlp.30.88
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Japanese Neural Incremental Text-to-Speech Synthesis Framework With an Accent Phrase Input2023
- 著者名/発表者名
  Yanagita Tomoya、Sakti Sakriani、Nakamura Satoshi
- 雑誌名
  
  IEEE Access
  
  巻: 11 ページ: 22355-22363
- DOI
  10.1109/access.2023.3251657
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] 日本語逐次音声合成における合成単位2022
- 著者名/発表者名
  柳田智也、サクテイサクリアニ、中村哲
- 雑誌名
  
  情報処理学会論文誌
  
  巻: 63 号: 4 ページ: 1149-1158
- DOI
  10.20729/00217617
- 年月日
  2022-04-15
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] Deficient-basis-complementary rank-constrained spatial covariance matrix estimation based on multivariate generalized Gaussian distribution for blind speech extraction2022
- 著者名/発表者名
  Yuto Kondo, Yuki Kubo, Norihiro Takamune , Daichi Kitamura, and Hiroshi Saruwatari
- 雑誌名
  
  EURASIP Journal on Advances in Signal Processing
  
  巻: 88(2022) 号: 1
- DOI
  10.1186/s13634-022-00905-z
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Neural Machine Translation with Synchronous Latent Phrase Structure2022
- 著者名/発表者名
  Shintaro Harada, Taro Watanabe
- 雑誌名
  
  自然言語処理
  
  巻: 29 号: 2 ページ: 587-610
- DOI
  10.5715/jnlp.29.587
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] TriECCC: Trilingual Corpus of the Extraordinary Chambers in the Courts of Cambodia for Speech Recognition and Translation Studies2022
- 著者名/発表者名
  Soky Kak、Mimura Masato、Kawahara Tatsuya、Chu Chenhui、Li Sheng、Ding Chenchen、Sam Sethserey
- 雑誌名
  
  International Journal of Asian Language Processing
  
  巻: 31 号: 03n04 ページ: 1-21
- DOI
  10.1142/s2717554522500072
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] A cyclical approach to synthetic and natural speech mismatch refinement of neural post-filter for low-cost text-to-speech system2022
- 著者名/発表者名
  Y.-C. Wu, P.L. Tobing, K. Yasuhara, N. Matsunaga, Y. Ohtani, T. Toda
- 雑誌名
  
  APSIPA Transactions on Signal and Information Processing
  
  巻: Vol. 11, No. 1, e30 号: 1
- DOI
  10.1561/116.00000020
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] A Machine Speech Chain Approach for Dynamically Adaptive Lombard TTS in Static and Dynamic Noise Environments2022
- 著者名/発表者名
  Novitasari Sashi、Sakti Sakriani、Nakamura Satoshi
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 30 ページ: 2673-2688
- DOI
  10.1109/taslp.2022.3196879
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Tackling multiple object tracking with complicated motions ? Re-designing the integration of motion and appearance2022
- 著者名/発表者名
  Yang Fan、Wang Zheng、Wu Yang、Sakti Sakriani、Nakamura Satoshi
- 雑誌名
  
  Image and Vision Computing
  
  巻: 124 ページ: 104514-104514
- DOI
  10.1016/j.imavis.2022.104514
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Modeling Unsupervised Empirical Adaptation by DPGMM and DPGMM-RNN Hybrid Model to Extract Perceptual Features for Low-resource ASR2022
- 著者名/発表者名
  Bin Wu, Sakriani Sakti, Jinsong Zhang, and Satoshi Nakamura
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: Vol. 30 ページ: 901-916
- DOI
  10.1109/taslp.2022.3150220
- 関連する報告書
  2022 実績報告書 2021 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Knowledge Distillation for Translating Erroneous Speech Transcriptions2022
- 著者名/発表者名
  Ryo Fukuda, Katsuhito Sudoh, Satoshi Nakamura
- 雑誌名
  
  自然言語処理
  
  巻: 29 号: 2 ページ: 344-366
- DOI
  10.5715/jnlp.29.344
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] How Remote Interpreting Changed the Japanese Interpreting Industry: Findings from an online survey conducted during the COVID-19 pandemic2022
- 著者名/発表者名
  Kayo Matsushita
- 雑誌名
  
  INContext: Studies in Translation and Interculturalism
  
  巻: 2(2) 号: 2 ページ: 167-185
- DOI
  10.54754/incontext.v2i2.22
- 関連する報告書
  2022 実績報告書
[雑誌論文] On Knowledge Distillation for Translating Erroneous Speech Transcriptions2022
- 著者名/発表者名
  Ryo Fukuda, Katsuhito Sudoh, and Satoshi Nakamura
- 雑誌名
  
  自然言語処理
  
  巻: 2-29
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Neural Incremental Speech Recognition Toward Real-Time Machine Speech Translation2021
- 著者名/発表者名
  Sashi Novitasari, Sakriani Sakti, Satoshi Nakamura,
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E104.D 号: 12 ページ: 2195-2208
- DOI
  10.1587/transinf.2021EDP7014
- NAID
  130008123347
- ISSN
  0916-8532, 1745-1361
- 年月日
  2021-12-01
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Synthesizing waveform sequence-to-sequence to augment training data for sequence-to-sequence speech recognition2021
- 著者名/発表者名
  S.Ueno, M.Mimura, S.Sakai, and T.Kawahara
- 雑誌名
  
  Acoustical Science and Technology
  
  巻: 42 号: 6 ページ: 333-343
- DOI
  10.1250/ast.42.333
- NAID
  130008110355
- ISSN
  0369-4232, 1346-3969, 1347-5177
- 年月日
  2021-11-01
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Alignment knowledge distillation for online streaming attention-based speech recognition2021
- 著者名/発表者名
  H.Inaguma and T.Kawahara
- 雑誌名
  
  IEEE/ACM Trans. Audio, Speech & Language Process
  
  巻: Vol.29 ページ: 1-15
- DOI
  10.1109/taslp.2021.3133217
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Audio-Oriented Video Interpolation Using Key Pose2021
- 著者名/発表者名
  Takayuki Nakatsuka, Yukitaka Tsuchiya, Masatoshi Hamanaka and Shigeo Morishima
- 雑誌名
  
  International Journal of Pattern Recognition and Artificial Intelligence
  
  巻: Vol. 35, No. 16 号: 16
- DOI
  10.1142/s0218001421600168
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Length-constrained Neural Machine Translation using Length Prediction and Perturbation into Length-aware Positional Encoding2021
- 著者名/発表者名
  Yui Oka, Katsuhito Sudoh, Satoshi Nakamura
- 雑誌名
  
  自然言語処理
  
  巻: 28 号: 3 ページ: 778-801
- DOI
  10.5715/jnlp.28.778
- NAID
  130008088116
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] End-to-End Image-to-Speech Generation for Untranscribed Unknown Languages2021
- 著者名/発表者名
  Johanes Effendi, Sakriani Sakti, Satoshi Nakamura
- 雑誌名
  
  IEEE Access
  
  巻: 9 ページ: 55144-55154
- DOI
  10.1109/access.2021.3071541
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス / 国際共著
[学会発表] 言語モデルの文法知識評価における間接肯定証拠の分析2024
- 著者名/発表者名
  大羽未悠, 大関洋平, 深津聡世, 芳賀あかり, 大内啓樹, 渡辺太郎, 菅原朔
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] 小規模言語モデルによる子供の過剰一般化のモデリング2024
- 著者名/発表者名
  芳賀あかり, 菅原朔, 深津聡世, 大羽未悠, 大内啓樹, 渡辺太郎, 大関洋平
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] テキストスタイル変換を用いた話し言葉音声合成2024
- 著者名/発表者名
  吉岡大貴，安田裕介，戸田智基
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 音声生成に関する情報処理技術の研究事例2024
- 著者名/発表者名
  戸田智基
- 学会等名
  人工知能研究センター第76回人工知能セミナー
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] Cocktail Machine Speech Chain: 重複あり音声を用いた音声認識・音声合成モデルの統一的学習2024
- 著者名/発表者名
  松永裕太
- 学会等名
  日本音響学会2024年春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] テキスト生成の自動評価尺度に基づく音声生成の自動評価2024
- 著者名/発表者名
  佐伯高明
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2023 実績報告書
[学会発表] 原発話に忠実な英日同時機械翻訳の実現に向けた順送り訳評価データ作成2024
- 著者名/発表者名
  福田りょう, 土肥康輔, 須藤克仁, 中村哲
- 学会等名
  情報処理学会第259回自然言語処理研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 文内コンテキストを利用した分割統治ニューラル機械翻訳2024
- 著者名/発表者名
  石川隆太, 加納保昌, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] タグ付き混合データ学習と自己教師あり学習による同時通訳データを用いたEnd-to-End同時音声翻訳2024
- 著者名/発表者名
  胡尤佳, 福田りょう, 西川勇太, 加納保昌, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] 文法項目の多様性と誤り情報を利用したエッセイ自動採点2024
- 著者名/発表者名
  土肥康輔,須藤克仁,中村哲
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] 同時通訳・同時翻訳のための語順同期性評価2024
- 著者名/発表者名
  蒔苗茉那, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] 漸進的な音声分割を用いたストリーミング同時音声翻訳2024
- 著者名/発表者名
  福田りょう, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] Model-based Subsampling for Knowledge Graph Completion2023
- 著者名/発表者名
  Xincan Feng, Hidetaka Kamigaito, Katsuhiko Hayashi, Taro Watanabe
- 学会等名
  13th International Joint Conference on Natural Language
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Generating Diverse Translation with Perturbed kNN-MT2023
- 著者名/発表者名
  Yuto Nishida, Makoto Morishita, Hidetaka Kamigaito, Taro Watanabe
- 学会等名
  18th Conference of the European Chapter of the Association for Computational Linguistics: Student Research Workshop
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] A comparative study of ethical norms of professional and non-professional interpreters in the media2023
- 著者名/発表者名
  Kayo Matsushita
- 学会等名
  6th International Conference on Non-Professional Interpreting and Translation
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Text-to-speech synthesis based on latent variable conversion using diffusion probabilistic model and variational autoencoder2023
- 著者名/発表者名
  Yusuke Yasuda, Tomoki Toda
- 学会等名
  IEEE ICASSP 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Source-Filter HiFiGAN: fast and pitch controllable high-fidelity neural vocoder2023
- 著者名/発表者名
  Reo Yoneyama, Yi-Chiao Wu, Tomoki Toda
- 学会等名
  IEEE ICASSP 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Emotion awareness in multi-utterance turn for improving emotion prediction in multi-speaker conversation2023
- 著者名/発表者名
  Xiaohan Shi, Xingfeng Li, Tomoki Toda
- 学会等名
  INTERSPEECH 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 注意機構付きVAEを用いたテキスト発話スタイル変換における少量パラレルデータの活用2023
- 著者名/発表者名
  吉岡大貴, 安田裕介, 戸田智基
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] A comparative study of voice conversion models with large-scale speech and singing data: the T13 systems for the Singing Voice Conversion Challenge 20232023
- 著者名/発表者名
  Ryuichi Yamamoto, Reo Yoneyama, Lester Phillip Violeta, Wen-Chin Huang, Tomoki Toda
- 学会等名
  IEEE ASRU 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Leveraging the Multilingual Indonesian Ethnic Languages Dataset in Self-supervised Model for Low-resource ASR Task2023
- 著者名/発表者名
  Sakriani Sakti, Benita Angela Titalim
- 学会等名
  IEEE ASRU
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Speech Recognition and Meaning Interpretation: Towards Disambiguation of Structurally Ambiguous Spoken Utterances in Indonesian2023
- 著者名/発表者名
  Ruhiyah Widiaputri, Ayu Purwarianti, Dessi Lestari, Kurniawati Azizah, Dipta Tanaya, Sakriani Sakti
- 学会等名
  EMNLP
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Generating Speech with Prosodic Prominence based on SSL-Visually Grounded Models2023
- 著者名/発表者名
  Ika Hartanti Bella Septina, Dipta Tanaya, Kurniawati Azizah, Dessi Lestari, Ayu Purwarianti, Sakriani Sakti
- 学会等名
  Oriental COCOSDA
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Exploring Difficulties Encountered by Professional Interpreters in Japanese-to-English and English-to-Japanese Simultaneous Translation2023
- 著者名/発表者名
  Hang Xi, Sakriani Sakti
- 学会等名
  Oriental COCOSDA
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] STEN-TTS: Improving Zero-shot Cross-Lingual Transfer for Multi-Lingual TTS with Style-Enhanced Normalization Diffusion Framework2023
- 著者名/発表者名
  Chung Tran, Chi Mai Luong, Sakriani Sakti
- 学会等名
  INTERSPEECH
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Unsupervised Learning of Discrete Latent Representations with Data-Adaptive Dimensionality from Continuous Speech Streams2023
- 著者名/発表者名
  Shun Takahashi, Sakriani Sakti
- 学会等名
  INTERSPEECH
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Low-Resource Japanese-English Speech-to-Text Translation Leveraging Speech-Text Unified-model Representation Learning2023
- 著者名/発表者名
  Tu Dinh Tran, Sakti Sakriani
- 学会等名
  INTERSPEECH Satellite Workshop - the ELRA/ISCA Special Interest Group on Under-resourced Languages (SIGUL)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] VGSAlign: Bilingual Speech Alignment of Unpaired and Untranscribed Languages using Self-Supervised Visually Grounded Speech Models2023
- 著者名/発表者名
  Luan Thanh Nguyen, Sakriani Sakti
- 学会等名
  INTERSPEECH Satellite Workshop - the ELRA/ISCA Special Interest Group on Under-resourced Languages (SIGUL)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] An Isotropy Analysis for Self-supervised Acoustic Unit Embeddings on the Zero Resource Speech Challenge 2021 Framework2023
- 著者名/発表者名
  Jianan Chen, Sakriani Sakti
- 学会等名
  IEEE ICASSP
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Self-adaptive Incremental Machine Speech Chain for Lombard TTS with High-granularity ASR Feedback in Dynamic Noise Condition2023
- 著者名/発表者名
  Sashi Novitasari, Sakriani Sakti, Satoshi Nakamura
- 学会等名
  IEEE ICASSP
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Language Technology for All: From the technology and indigenous community perspectives2023
- 著者名/発表者名
  Sakriani Sakti
- 学会等名
  Oriental COCOSDA
- 関連する報告書
  2023 実績報告書
- 国際学会 / 招待講演
[学会発表] E2E Refined Dataset2023
- 著者名/発表者名
  Keisuke Toyama, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  26th International Conference of Oriental-COCOSDA 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Investigation of Validity of Paradigmatic Diagnosis for Downstep in Japanese2023
- 著者名/発表者名
  Kei Furukawa, Satoshi Nakamura
- 学会等名
  26th International Conference of Oriental-COCOSDA 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Inter-connection: Effective Connection between Pre-trained Encoder and Decoder for Speech Translation2023
- 著者名/発表者名
  Yuta Nishikawa, Satoshi Nakamura
- 学会等名
  INTERSPEECH2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Boundary-Driven Account for Downstep in Japanese2023
- 著者名/発表者名
  Kei Furukawa, Satoshi Nakamura
- 学会等名
  20th International Congress of Phonetic Sciences
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Learning to Speak from Text: Zero-Shot Multilingual Text-to-Speech with Unsupervised Text Pretraining2023
- 著者名/発表者名
  Takaaki Saeki
- 学会等名
  The 32nd International Joint Conference on Artificial Intelligence (IJCAI 2023) Main Track
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] NAIST Simultaneous Speech Translation System for IWSLT 20232023
- 著者名/発表者名
  Ryo Fukuda, Yuta Nishikawa, Yasumasa Kano, Yuka Ko, Tomoya Yanagita, Kosuke Doi, Mana Makinae, Sakriani Sakti, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  the 20th International Conference on Spoken Language Translation (IWSLT 2023)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Tagged End-to-End Simultaneous Speech Translation Training using Simultaneous Interpretation Data2023
- 著者名/発表者名
  Yuka Ko, Ryo Fukuda, Yuta Nishikawa, Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  the 20th International Conference on Spoken Language Translation (IWSLT 2023)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Average Token Delay: A Latency Metric for Simultaneous Translation2023
- 著者名/発表者名
  Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  Interspeech 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] E2E Refined Dataset2023
- 著者名/発表者名
  Keisuke Toyama, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  the 26th International Conference of Oriental-COCOSDA
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Average Token Delay: 同時通訳の遅延評価尺度2023
- 著者名/発表者名
  加納保昌, 須藤克仁, 中村哲
- 学会等名
  日本通訳翻訳学会第24回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] Embedding articulatory constraints for low-resource speech recognition based on large pre-trained model.2023
- 著者名/発表者名
  J.Lee, M.Mimura, and T.Kawahara.
- 学会等名
  INTERSPEECH
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Time-domain speech enhancement assisted by multi-resolution frequency encoder and decoder.2023
- 著者名/発表者名
  H.Shi, M.Mimura, L.Wang, J.Dang, and T.Kawahara.
- 学会等名
  IEEE-ICASSP
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Domain and language adaptation using heterogeneous datasets for wav2vec2.0-based speech recognition of low-resource language.2023
- 著者名/発表者名
  K.Soky, S.Li, C.Chu, and T.Kawahara.
- 学会等名
  IEEE-ICASSP
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Keep Eyes on the Sentence: An Interactive Sentence Simplification System for English Learners Based on Eye Tracking and Large Language Models2023
- 著者名/発表者名
  Taichi Higasa, Keitaro Tanaka, Qi Feng, Shigeo Morishima
- 学会等名
  ACM CHI Conference on Human Factors in Computing Systems, CHI 2024 (Late-Breaking Work)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Gaze-Driven Sentence Simplification for Language Learners: Enhancing Comprehension and Readability2023
- 著者名/発表者名
  Taichi Higasa, Keitaro Tanaka, Qi Feng, Shigeo Morishima
- 学会等名
  The 25th International Conference on Multimodal Interaction, ICMI 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Audio-Visual Speech Enhancement With Selective Off-Screen Speech Extraction2023
- 著者名/発表者名
  Tomoya Yoshinaga, Keitaro Tanaka, Shigeo Morishima
- 学会等名
  The 31st European Signal Processing Conference, EUSIPCO2023, Best Student Paper Contest Finalist
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Efficient 3D Reconstruction of NeRF using Camera Pose Interpolation and Photometric Bundle Adjustment2023
- 著者名/発表者名
  Tsukasa Takeda, Shugo Yamaguchi, Kazuhito Sato, Kosuke Fukazawa, Shigeo Morishima
- 学会等名
  ACM Special Interest Group on Computer Graphics and Interactive Techniques Conference, SIGGRAPH 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Deformable Neural Radiance Fields for Object Motion Blur Removal2023
- 著者名/発表者名
  Kazuhito Sato, Shugo Yamaguchi, Tsukasa Takeda, and Shigeo Morishima
- 学会等名
  ACM Special Interest Group on Computer Graphics and Interactive Techniques Conference Posters, SIGGRAPH 2023 Posters
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Improving the Gap in Visual Speech Recognition Between Normal and Silent Speech Based on Metric Learning2023
- 著者名/発表者名
  Sara Kashiwagi, Keitaro Tanaka, Qi Feng, Shigeo Morishima
- 学会等名
  INTERSPEECH2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Memory Efficient Diffusion Probabilistic Models via Patch-based Generation2023
- 著者名/発表者名
  Shinei Arakawa, Hideki Tsunashima, Daichi Horita, Keitaro Tanaka, Shigeo Morishima
- 学会等名
  The IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop 2023, CVPR workshop 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] vTTS: visual-text to speech2023
- 著者名/発表者名
  Yoshifumi Nakano
- 学会等名
  IEEE SLT 2022
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] 日本語音声合成におけるアクセント句韻律特徴量の表現と予測2023
- 著者名/発表者名
  佐藤匡紀
- 学会等名
  音声研究会 (SP)
- 関連する報告書
  2022 実績報告書
[学会発表] 動画キャプションモデルを用いた字幕翻訳の検討2023
- 著者名/発表者名
  成浦拓音
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] Cyclic Partially-aligned Transformer for Visually Connected Speech-to-text Mapping2023
- 著者名/発表者名
  J. Effendi, S. Sakti, S. Nakamura
- 学会等名
  The 2023 Spring meeting of the Acoustical Society of Japan (ASJ)
- 関連する報告書
  2022 実績報告書
[学会発表] インクリメンタル音声合成のための逐次読み・アクセント推定法の検討2023
- 著者名/発表者名
  柳田智也, 中村哲
- 学会等名
  日本音響学会　2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 事前学習モデルによる分割統治ニューラル機械翻訳2023
- 著者名/発表者名
  石川隆太, 加納保昌, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 音声機械翻訳の時間効率と精度を改善するための連続音声分割2023
- 著者名/発表者名
  福田りょう, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] エッセイ自動採点における文法特徴と学習者レベルの関係2023
- 著者名/発表者名
  土肥康輔，須藤克仁，中村哲
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] Average Token Delay: 同時翻訳の遅延評価尺度2023
- 著者名/発表者名
  加納保昌, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 同時通訳品質評価方法検討のための同時通訳者と翻訳者の評価比較分析2023
- 著者名/発表者名
  蒔苗茉那, 須藤克仁, 中村哲, 松下佳世, 山田優
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 非流暢性タグを用いた目的言語テキストによる自由発話の音声翻訳2023
- 著者名/発表者名
  胡尤佳, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 日英翻訳を対象としたイディオム表現の評価指標の提案2023
- 著者名/発表者名
  廣瀬惟歩, 渡辺太郎
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 摂動を加えた kNN 機械翻訳による多様な翻訳候補の生成2023
- 著者名/発表者名
  西田悠人, 森下睦, 上垣外英剛, 渡辺太郎
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] Detection of Selective Attention processing during Simultaneous Interpretation by EEG Auditory Steady-State response-related Phase-Amplitude Coupling2022
- 著者名/発表者名
  Haruko Yagura, Hiroki Tanaka, Katsuhito Sudoh, and Satoshi Nakamura
- 学会等名
  NEURO2022
- 関連する報告書
  2022 実績報告書
[学会発表] Adapting to Non-Centered Languages for Zero-shot Multilingual Translation2022
- 著者名/発表者名
  Zhi Qu
- 学会等名
  the 29th International Conference on Computational Linguistics
- 関連する報告書
  2022 実績報告書
[学会発表] Sharing Parameter by Conjugation for Knowledge Graph Embeddings in Complex Space2022
- 著者名/発表者名
  Xincan Feng
- 学会等名
  TextGraphs-16: Graph-based Methods for Natural Language Processing
- 関連する報告書
  2022 実績報告書
[学会発表] Phone-informed refinement of synthesized mel spectrogram for data augmentation in speech recognition.2022
- 著者名/発表者名
  S.Ueno
- 学会等名
  IEEE-ICASSP
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Leveraging simultaneous translation for enhancing transcription of low-resource language via cross attention mechanism.2022
- 著者名/発表者名
  K.Soky
- 学会等名
  INTERSPEECH
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] End-to-end speech-to-punctuated-text recognition.2022
- 著者名/発表者名
  J.Nozaki
- 学会等名
  INTERSPEECH
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Non-autoregressive error correction for CTC-based ASR with phone-conditioned masked LM.2022
- 著者名/発表者名
  H.Futami
- 学会等名
  INTERSPEECH
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Towards the establishment of a quality assessment framework for interpreting performance2022
- 著者名/発表者名
  Kayo Matsushita, Masaru Yamada
- 学会等名
  Translation in Transition 6 Conference
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Syntactic Cross and Reading Effort in English to Japanese Translation2022
- 著者名/発表者名
  Takanori Mizowaki, Haruka Ogawa, Masaru Yamada
- 学会等名
  The proceedings of Workshop on Empirical Translation Process Research, The 15th Conference of the Association for Machine Translation in the Americas (AMTA)
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] 注意機構付きVAEを用いたテキスト発話スタイル変換の改良2022
- 著者名/発表者名
  吉岡大貴, 安田裕介, 松永悟行, 大谷大和, 戸田智基
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 拡散確率モデルとアライメントモデルを用いた潜在特徴系列変換に基づくテキスト音声合成2022
- 著者名/発表者名
  安田裕介, 戸田智基
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] Interpretable emotional control for text-to-speech system toward development of sympathetic educational-support robots2022
- 著者名/発表者名
  J. Feng, T. Yoshikawa, T. Toda
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] Unified source-filter GAN with harmonic-plus-noise source excitation generation2022
- 著者名/発表者名
  R. Yoneyama, Y.-C. Wu, T. Toda
- 学会等名
  INTERSPEECH
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Interpretable control for emotional text-to-speech system toward development of sympathetic educational-support robots2022
- 著者名/発表者名
  J. Feng, T. Yoshikawa, T. Toda
- 学会等名
  APSIPA ASC
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] 内容語保存機構を備えた変分自己符号化器に基づくテキスト発話スタイル変換2022
- 著者名/発表者名
  吉岡大貴, 安田裕介, 松永悟行, 大谷大和, 戸田智基
- 学会等名
  情報処理学会音声言語情報処理研究会
- 関連する報告書
  2022 実績報告書
[学会発表] 合成音声の主観評価結果の統計的解析2022
- 著者名/発表者名
  安田裕介, 戸田智基
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] SiFi-GAN：音源フィルタ構造に基づくHiFi-GAN2022
- 著者名/発表者名
  米山怜於, Y.-C. Wu, 戸田智基
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] サイクル学習を用いた注意機構付きVAEによるテキスト発話スタイル変換2022
- 著者名/発表者名
  吉岡大貴, 安田裕介, 松永悟行, 大谷大和, 戸田智基
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] Improved Consistency Training for Semi-Supervised Sequence-to-Sequence ASR via Speech Chain Reconstruction and Self-Transcribing2022
- 著者名/発表者名
  H. Qi, S. Novitasari, S. Sakti, S. Nakamura
- 学会等名
  INTERSPEECH
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Improved Consistency Training for Semi-Supervised Sequence-to-Sequence ASR via Speech Chain Reconstruction and Self-Transcribing2022
- 著者名/発表者名
  Heli Qi, Sashi Novitasari, Sakriani Sakti, Satoshi Nakamura
- 学会等名
  INTERSPEECH
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Representing ‘how you say’ with ‘what you say’:English corpus of focused speech and text reflecting corresponding implications2022
- 著者名/発表者名
  Naoaki Suzuki, Satoshi Nakamura
- 学会等名
  INTERSPEECH
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Speech Segmentation Optimization using Segmented Bilingual Speech Corpus for End-to-end Speech Translation2022
- 著者名/発表者名
  Ryo Fukuda, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  INTERSPEECH
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Applying Syntax?Prosody Mapping Hypothesis and Prosodic Well-Formedness Constraints to Neural Sequence-to-Sequence Speech Synthesis2022
- 著者名/発表者名
  Kei Furukawa, Takeshi Kishiyama, Satoshi Nakamura
- 学会等名
  INTERSPEECH
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Simultaneous Neural Machine Translation with Prefix Alignment2022
- 著者名/発表者名
  Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  19th International Conference on Spoken Language Translation (IWSLT 2022)
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] NAIST Simultaneous Speech-to-Text Translation System for IWSLT 20222022
- 著者名/発表者名
  Ryo Fukuda, Yuka Ko, Yasumasa Kano, Kosuke Doi, Hirotaka Tokuyama, Sakriani Sakti, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  19th International Conference on Spoken Language Translation (IWSLT 2022)
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] どう言ったかを何を言ったかで表す～フォーカスを含んだ発話及びその含意を反映したテキストを含む英語コーパス～2022
- 著者名/発表者名
  鱸尚晃, 中村哲
- 学会等名
  第24回音声言語シンポジウム（SP/SLP）兼第9回自然言語処理シンポジウム
- 関連する報告書
  2022 実績報告書
[学会発表] NAIST同時通訳コーパスの構築：翻訳字幕との比較と通訳経験年数に基づく分析2022
- 著者名/発表者名
  土肥康輔，須藤克仁，中村哲
- 学会等名
  日本通訳翻訳学会第23回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 視線情報と比喩度に基づく英語フレーズの理解度推定2022
- 著者名/発表者名
  樋笠泰祐，平田明日香，田中啓太郎，森島繁生
- 学会等名
  第30回インタラクティブシステムとソフトウェアに関するワークショップ , WISS 2022
- 関連する報告書
  2022 実績報告書
[学会発表] Unsupervised Disentanglement of Timbral, Pitch, and Variation Features From Musical Instrument Sounds With Random Perturbation2022
- 著者名/発表者名
  Keitaro Tanaka, Yoshiaki Bando, Kazuyoshi Yoshii, and Shigeo Morishima
- 学会等名
  APSIPA ASC 2022
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] The Sound of Bounding-Boxes2022
- 著者名/発表者名
  Takashi Oya, Shohei Iwase, Shigeo Morishima
- 学会等名
  International Conference on Pattern Recognition 2022 , ICPR 2022
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Audio-Driven Violin Performance Animation with Clear Fingering and Bowing2022
- 著者名/発表者名
  Asuka Hirata, Keitaro Tanaka, Masatoshi Hamanaka, Shigeo Morishima
- 学会等名
  The Premier Conference & Exhibition on Computer Graphics & Interactive Techniques, SIGGRAPH 2022
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] 画像文字からの音声合成2022
- 著者名/発表者名
  中野嘉文，佐伯高明，高道慎之介，須藤克仁，猿渡洋
- 学会等名
  言語処理学会2022年年次大会
- 関連する報告書
  2021 実績報告書
[学会発表] JTubeSpeech: 音声認識と話者照合のためにYouTubeから構築される日本語音声コーパス2022
- 著者名/発表者名
  高道慎之介，Kurzinger Ludwig，佐伯高明，塩田さやか，渡部晋治
- 学会等名
  言語処理学会2022年年次大会
- 関連する報告書
  2021 実績報告書
[学会発表] IWSLT Evaluation Campaign: Simultaneous Speech Translation2022
- 著者名/発表者名
  須藤克仁
- 学会等名
  情報処理学会第141回音声言語情報処理研究会
- 関連する報告書
  2021 実績報告書
- 国際学会 / 招待講演
[学会発表] Machine Speech Chain による音声聴取生成システムのモデル化の試み2022
- 著者名/発表者名
  中村哲
- 学会等名
  日本音響学会2022年春季研究発表会
- 関連する報告書
  2021 実績報告書
- 招待講演
[学会発表] 音声機械翻訳のための音声翻訳コーパスに基づく発話分割2022
- 著者名/発表者名
  福田りょう, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第28回年次大会
- 関連する報告書
  2021 実績報告書
[学会発表] 構文ラベル予測による同時ニューラル機械翻訳2022
- 著者名/発表者名
  Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  言語処理学会第28回年次大会
- 関連する報告書
  2021 実績報告書
[学会発表] Masked Language Model による系列確率に基づく文法誤り検出2022
- 著者名/発表者名
  土肥康輔，須藤克仁，中村哲
- 学会等名
  言語処理学会第28回年次大会
- 関連する報告書
  2021 実績報告書
[学会発表] 音声認識出力の曖昧性に頑健な音声翻訳のための音声認識の精度ごとの性能比較2022
- 著者名/発表者名
  胡尤佳，須藤克仁，Sakriani Sakti，中村哲
- 学会等名
  言語処理学会第28回年次大会
- 関連する報告書
  2021 実績報告書
[学会発表] Low-Latency Incremental Text-to-Speech Synthesis with Distilled Context Prediction Network2021
- 著者名/発表者名
  Takaaki Saeki, Shinnosuke Takamichi, Hiroshi Saruwatari
- 学会等名
  Proc. ASRU
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] An end-to-end model from speech to clean transcript for parliamentary meetings2021
- 著者名/発表者名
  M.Mimura, S.Sakai, and T.Kawahara
- 学会等名
  In Proc. APSIPA ASC
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] VAD-free streaming hybrid CTC/Attention ASR for unsegmented recording2021
- 著者名/発表者名
  H.Inaguma, M.Mimura, and T.Kawahara
- 学会等名
  In Proc. INTERSPEECH
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] StableEmit: Selection probability discount for reducing emission latency of streaming monotonic attention ASR2021
- 著者名/発表者名
  H.Inaguma, M.Mimura, and T.Kawahara
- 学会等名
  In Proc. INTERSPEECH
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] USING LOCAL PHRASE DEPENDENCY STRUCTURE INFORMATION IN NEURAL SEQUENCE-TO-SEQUENCE SPEECH SYNTHESIS2021
- 著者名/発表者名
  Nobuyoshi Kaiki, Sakriani Sakti and Satoshi Nakamura
- 学会等名
  O-COCOSDA 2021
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Unsupervised Neural-Based Graph Clustering for Variable-Length Speech Representation Discovery of Zero-Resource Languages2021
- 著者名/発表者名
  Shun Takahashi, Sakriani Sakti, Satoshi Nakamura
- 学会等名
  Proc. Interspeech 2021
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Dynamically Adaptive Machine Speech Chain Inference for TTS in Noisy Environment: Listen and Speak Louder2021
- 著者名/発表者名
  Sashi Novitasari, Sakriani Sakti, Satoshi Nakamura
- 学会等名
  Proc. Interspeech 2021
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Weakly-supervised Speech-to-text Mapping with Visually Connected Non-parallel Speech-text Data using Cyclic Partially-aligned Transformer2021
- 著者名/発表者名
  Johanes Effendi, Sakriani Sakti, Satoshi Nakamura
- 学会等名
  Proc. Interspeech 2021
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Transcribing Paralinguistic Acoustic Cues to Target Language Text in Transformer-Based Speech-to-Text Translation2021
- 著者名/発表者名
  Hirotaka Tokuyama, Sakriani Sakti, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  Proc. Interspeech 2021
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Large-Scale English-Japanese Simultaneous Interpretation Corpus: Construction and Analyses with Sentence-Aligned Data2021
- 著者名/発表者名
  Kosuke Doi, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  Proc. IWSLT
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Simultaneous Speech-to-speech Translation System with Transformer-based Incremental ASR, MT, and TTS2021
- 著者名/発表者名
  Ryo Fukuda, Sashi Novitasari, Yui Oka, Yasumasa Kano, Yuki Yano, Yuka Ko, Hirotaka Tokuyama, Kosuke Doi, Tomoya Yanagita, Sakriani Sakti, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  Proc. Oriental COCOSDA, 2021
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] ASR Posterior-Based Loss for Multi-Task End-to-End Speech Translation2021
- 著者名/発表者名
  Yuka Ko, Katsuhito Sudoh, Sakriani Sakti, Satoshi Nakamura
- 学会等名
  Proc. Interspeech
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Multichannel Audio Source Separation with Independent Deeply Learned Matrix Analysis Using Product of Source Models2021
- 著者名/発表者名
  Takuya Hasumi, Tomohiko Nakamura, Norihiro Takamune, Hiroshi Saruwatari, Daichi Kitamura, Yu Takahashi, Kazunobu Kondo
- 学会等名
  Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2021 (APSIPA ASC 2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] 多変量一般化Gauss分布に基づくランク制約付き空間共分散行列推定法における雑音欠落ランク空間基底推定2021
- 著者名/発表者名
  近藤祐斗，久保優騎，高宗典玄，北村大地，猿渡洋
- 学会等名
  日本音響学会2021秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] Product of Priors型確率分布を導入した音源モデルに基づく独立深層学習行列分析による多チャネル音源分離2021
- 著者名/発表者名
  蓮実拓也，中村友彦，高宗典玄，猿渡洋，北村大地，高橋祐，近藤多伸
- 学会等名
  日本音響学会2021秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] ヘビーテイル生成モデルに基づく独立深層学習テンソル分析2021
- 著者名/発表者名
  成澤直輝，池下林太郎，高宗典玄，北村大地，中村友彦，猿渡洋，中谷智広
- 学会等名
  日本音響学会2021秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 独立深層学習行列分析を用いたランク制約付き空間共分散行列推定による音声強調2021
- 著者名/発表者名
  三澤颯大，中村友彦，高宗典玄，北村大地，猿渡洋
- 学会等名
  日本音響学会2021秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] ドメイン適応と話者一致損失を用いた話者適応によるクロスリンガル音声合成2021
- 著者名/発表者名
  辛徳泰，齋藤佑樹，高道慎之介，郡山知樹，猿渡洋
- 学会等名
  日本音響学会2021秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 大規模言語モデルの知識蒸留によるコンテキスト推定モデルを用いた低遅延逐次音声合成2021
- 著者名/発表者名
  佐伯高明，高道慎之介，猿渡洋
- 学会等名
  日本音響学会2021秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] ASR rescoring and confidence estimation with ELECTRA2021
- 著者名/発表者名
  H.Futami, H.Inaguma, M.Mimura, S.Sakai, and T.Kawahara
- 学会等名
  IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Data augmentation for ASR using TTS via a discrete representation2021
- 著者名/発表者名
  S.Ueno, M.Mimura, S.Sakai, and T.Kawahara
- 学会等名
  IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Light Source Selection in Primary Sample Space Neural Photon Sampling2021
- 著者名/発表者名
  Yuta tsuji, Tatsuya Yatagawa, Shigeo Morishima
- 学会等名
  The 14th ACM SIGGRAPH Conference and Exhibition on Computer Graphics and Interactive Techniques in Asia 2021
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Low-latency real-time non-parallel voice conversion based on cyclic variational autoencoder and multiband WaveRNN with data-driven linear prediction2021
- 著者名/発表者名
  Patrick Lumban Tobing, Tomoki Toda
- 学会等名
  11th ISCA Speech Synthesis Workshop (SSW)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] High-fidelity and low-latency universal neural vocoder based on multiband WaveRNN with data-driven linear prediction for discrete waveform modeling2021
- 著者名/発表者名
  Patrick Lumban Tobing, Tomoki Toda
- 学会等名
  INTERSPEECH
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Relational data selection for data augmentation of speaker-dependent multi-band MelGAN vocoder2021
- 著者名/発表者名
  Yi-Chiao Wu, Cheng-Hung Hu, Hung-Shin Lee, Yu-Huai Peng, Wen-Chin Huang, Yu Tsao, Hsin-Min Wang, Tomoki Toda
- 学会等名
  INTERSPEECH
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] NAIST English-to-Japanese Simultaneous Translation System for IWSLT 2021 Simultaneous Text-to-text Task2021
- 著者名/発表者名
  Ryo Fukuda, Yui Oka, Yasumasa Kano, Yuki Yano, Yuka Ko, Hirotaka Tokuyama, Kosuke Doi, Sakriani Sakti, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  the 18th International Conference on Spoken Language Translation (IWSLT 2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] On Knowledge Distillation for Translating Erroneous Speech Transcriptions2021
- 著者名/発表者名
  Ryo Fukuda, Katsuhito Sudoh, Satoshi Nakamura
- 学会等名
  the 18th International Conference on Spoken Language Translation
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Recent Advances in Speech Translation2021
- 著者名/発表者名
  Satoshi Nakamura, with Katsuhito Sudo, Sakriani Sakti, Ryo Fukuda, Sashi Novitasari, Tomoya Yanagita, Kosuke Doi, Yasumasa Kano, Yuki Yano, Hirotaka Tokuyama, Yui Oka
- 学会等名
  AI Innovation Summit 2021
- 関連する報告書
  2021 実績報告書
- 国際学会 / 招待講演
[学会発表] Improving Intelligibility of Synthesized Speech in Noisy Condition with Dynamically Adaptive Machine Speech Chain2021
- 著者名/発表者名
  Sashi Novitasari, Sakriani Sakti, Satoshi Nakamura
- 学会等名
  SIG-SLP 2021
- 関連する報告書
  2021 実績報告書
[学会発表] 局所的な句構造の情報を用いたニューラル音声合成2021
- 著者名/発表者名
  海木延佳, サクティサクリアニ, 中村哲
- 学会等名
  音学シンポジウム2021
- 関連する報告書
  2021 実績報告書
[学会発表] ゼロ資源状況におけるサブワード単位の獲得にむけてグラフニューラルネットワークを用いた手法2021
- 著者名/発表者名
  高橋舜、サクリアニサクティ、中村哲
- 学会等名
  2021年度人工知能学会全国大会 (第35回)
- 関連する報告書
  2021 実績報告書
[図書] Utilizing remote simultaneous interpreting data for interpreting quality assessment A corpus-based study2023
- 著者名/発表者名
  Masaru Yamada, Kayo Matsushita, Hiroyuki Ishizuka
- 総ページ数
  17
- 出版者
  Routledge
- 関連する報告書
  2023 実績報告書
[産業財産権] 音声合成装置、音声合成方法及び音声合成プログラム2022
- 発明者名
  高道慎之介, 佐伯高明, 猿渡洋
- 権利者名
  高道慎之介, 佐伯高明, 猿渡洋
- 産業財産権種類
  特許
- 産業財産権番号
  2022-020534
- 出願年月日
  2022
- 関連する報告書
  2021 実績報告書

多元自動通訳システムと評価法に関する研究とその応用展開

研究代表者

中村 哲 奈良先端科学技術大学院大学, 研究推進機構, 特任教授 (30263429)

189,280千円 (直接経費: 145,600千円、間接経費: 43,680千円)

現在までの達成度 (区分)

理由

中間評価所見 (区分)

報告書

研究成果

[雑誌論文] Emotion-controllable Speech Synthesis using Emotion Soft Label, Utterance-level Prosodic Factors, and Word-level Prominence2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Text-Inductive Graphone-Based Language Adaptation for Low-Resource Speech Synthesis2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Improving Speech Translation Accuracy and Time Efficiency With Fine-Tuned wav2vec 2.0-Based Speech Segmentation2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Prefix Alignment for Training Simultaneous Machine Translation2024

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[雑誌論文] Sound Field Interpolation for Rotation-Invariant Multichannel Array Signal Processing2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] PoP-IDLMA: Product-of-Prior Independent Deeply Learned Matrix Analysis for Multichannel Music Source Separation2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Content Order-Controllable MR-to-Text2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] 国会会議録のための音声から書き言葉への end-to-end 変換2023

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[雑誌論文] Japanese Neural Incremental Text-to-Speech Synthesis Framework With an Accent Phrase Input2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] 日本語逐次音声合成における合成単位2022

著者名/発表者名

雑誌名

DOI

年月日

関連する報告書

[雑誌論文] Deficient-basis-complementary rank-constrained spatial covariance matrix estimation based on multivariate generalized Gaussian distribution for blind speech extraction2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Neural Machine Translation with Synchronous Latent Phrase Structure2022

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[雑誌論文] TriECCC: Trilingual Corpus of the Extraordinary Chambers in the Courts of Cambodia for Speech Recognition and Translation Studies2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] A cyclical approach to synthetic and natural speech mismatch refinement of neural post-filter for low-cost text-to-speech system2022

著者名/発表者名

中村哲奈良先端科学技術大学院大学, 研究推進機構, 特任教授 (30263429)