深層学習による無音声発話インタラクションの研究

研究課題

研究課題/領域番号	19H04148
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
審査区分	小区分61020:ヒューマンインタフェースおよびインタラクション関連
研究機関	東京大学
研究代表者	暦本純一東京大学, 大学院情報学環・学際情報学府, 教授 (20463896)
研究期間 (年度)	2019-04-01 – 2022-03-31
研究課題ステータス	完了 (2021年度)
配分額 *注記	17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円) 2021年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円) 2020年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円) 2019年度: 7,930千円 (直接経費: 6,100千円、間接経費: 1,830千円)
キーワード	サイレントスピーチ / 人間拡張 / 人工知能 / 音声処理 / 深層学習 / ヒューマンコンピュータインタラクション / ウィスパースピーチ / Human-AI-Integration / スピーチインタラクション / マルチモーダルインタラクション / サイレントボイス / ヒューマンAIインテグレーション / スピーチインタフェース
研究開始時の研究の概要	深層学習による無音声発話（声帯を振動させずに、発話の口腔動作のみを行う）の認識の研究を行う。プローブにより取得する口腔の映像情報から、利用者が声帯を振動させずに発話した発声内容を認識し、音響特徴を生成するニューラルネットモデルを構築する。人間とコンピュータが緊密に連携した種々のインタラクションを支援する新しいウェアラブルコンピュータの構成が可能になる。また、咽頭障害、声帯機能障害、高齢による発声困難者に対して、声によるコミュニケーションを取り戻すための支援技術基盤を提供する。
研究成果の概要	音声インタフェースは急速に普及してきているが、公共環境や騒音環境で利用できないなどの制限があった。本課題では、深層学習による無音声発話認識の研究を行った。顎の下側に取り付けられた超音波イメージングプローブによって観察される口腔内映像から発声内容を認識する深層学習器、皮膚運動を顎や喉に添付した加速度センサーから発話を推定する機構、マスクに添付した加速度センサーにより発話を認識する機構を構築し、スマートスピーカーなど音声対話システムを駆動できることを確認した。さらに、視線情報と口唇映像からのコマンド認識を組み合わせるマルチモーダルインタフェースの構築に成功した。
研究成果の学術的意義や社会的意義	本研究成果により、音声インタラクションが公共環境や騒音環境で利用できないなどの従来の制限を超えて利用できる可能性が出てきた。音声インタラクションは他の入力手段と比較しても高速で、手指を拘束しないなどの特徴を持つ。未来のモバイルインタフェースやウェアラブルインタフェースの手段としてサイレントスピーチが広範に利用される可能性がある。さらに、咽頭障害、声帯機能障害、高齢による発声困難者に対して、声によるコミュニケーションを取り戻すための支援技術としての利用意義がある。

報告書

(4件)

研究成果
(18件)

すべて 2022 2021 2020 2019 その他

すべて国際共同研究 (1件) 雑誌論文 (8件) (うち国際共著 3件、査読あり 8件) 学会発表 (7件) (うち国際学会 5件、招待講演 4件) 備考 (1件) 学会・シンポジウム開催 (1件)

[国際共同研究] Georgia Institute of Technology/college of computing(米国)
- 関連する報告書
  2019 実績報告書
[雑誌論文] SilentSpeller: Towards mobile, hands-free, silent speech text entry using electropalatography2022
- 著者名/発表者名
  Kimura Naoki、Gemicioglu Tan、Womack Jonathan、Li Richard、Zhao Yuhui、Bedri Abdelkareem、Su Zixiong、Olwal Alex、Rekimoto Jun、Starner Thad
- 雑誌名
  
  Proceedings of the ACM on Human-Computer Interaction
  
  巻: - ページ: 1-5
- DOI
  10.1145/3491102.3502015
- 関連する報告書
  2021 実績報告書
- 査読あり / 国際共著
[雑誌論文] JustSpeak: Automated, User-Configurable, Interactive Agents for Speech Tutoring2021
- 著者名/発表者名
  Xinlei Zhang, Takashi Miyaki, and Jun Rekimoto
- 雑誌名
  
  Proc. ACM Hum.-Comput. Interact. 5, EICS
  
  巻: Article 202 号: EICS ページ: 24-24
- DOI
  10.1145/3459744
- 関連する報告書
  2021 実績報告書
- 査読あり / 国際共著
[雑誌論文] Gaze+Lip: Rapid, Precise and Expressive Interactions Combining Gaze Input and Silent Speech Commands for Hands-free Smart TV Control2021
- 著者名/発表者名
  Su Zixiong、Zhang Xinlei、Kimura Naoki、Rekimoto Jun
- 雑誌名
  
  ETRA21 ACM Symposium on Eye Tracking Research and Applications
  
  巻: - ページ: 1-6
- DOI
  10.1145/3448018.3458011
- 関連する報告書
  2021 実績報告書
- 査読あり / 国際共著
[雑誌論文] Human Augmentation for Skill Acquisition and Skill Transfer2021
- 著者名/発表者名
  Hideki Koike, Jun Rekimoto, Junichi Ushiba, Shinichi Furuya, and Asa Ito
- 雑誌名
  
  In Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems (CHI EA '21). Association for Computing Machinery
  
  巻: Article 93 ページ: 1-3
- DOI
  10.1145/3411763.3441354
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] A Language Acquisition Support System that Presents Differences and Distances from Model Speech2021
- 著者名/発表者名
  Kazuki Kawamura and Jun Rekimoto
- 雑誌名
  
  The Adjunct Publication of the 34th Annual ACM Symposium on User Interface Software and Technology. Association for Computing Machinery
  
  巻: - ページ: 44-46
- DOI
  10.1145/3474349.3480225
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] SilentMask: Mask-type Silent Speech Interface with Measurement of Mouth Movement2021
- 著者名/発表者名
  Hirotaka Hiraki, Jun Rekimoto
- 雑誌名
  
  Augmented Humans 2020
  
  巻: 2021 ページ: 1-8
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Derma: Silent Speech Interaction Using Transcutaneous Motion Sensing2021
- 著者名/発表者名
  Jun Rekimoto, Yu Nishimura
- 雑誌名
  
  Augmented Humans 2020
  
  巻: 2021 ページ: 1-8
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] TieLent: A Casual Neck-Mounted Mouth Capturing Device for Silent Speech Interaction2020
- 著者名/発表者名
  Kimura Naoki、Hayashi Kentaro、Rekimoto Jun
- 雑誌名
  
  AVI 2020
  
  巻: 2020 ページ: 1-8
- DOI
  10.1145/3399715.3399852
- 関連する報告書
  2020 実績報告書
- 査読あり
[学会発表] Human Augmentation and the future of Human-Computer Integration2020
- 著者名/発表者名
  Jun Rekimoto
- 学会等名
  IEEE InTech 2020
- 関連する報告書
  2020 実績報告書
- 国際学会 / 招待講演
[学会発表] Human Augmentation:人間の能力の拡張と進化2020
- 著者名/発表者名
  暦本純一
- 学会等名
  MIRU2020
- 関連する報告書
  2020 実績報告書
- 招待講演
[学会発表] SottoVoce: 超音波画像と深層学習による無発声音声インタラクション2019
- 著者名/発表者名
  暦本純一，木村直紀，河野通就
- 学会等名
  インタラクション2019
- 関連する報告書
  2019 実績報告書
[学会発表] Homo Cyberneticus: The Era of Human-AI Integration2019
- 著者名/発表者名
  Jun Rekimoto
- 学会等名
  ACM UIST 2019
- 関連する報告書
  2019 実績報告書
- 国際学会
[学会発表] Human Augmentation and the future of Human-Computer Interactions2019
- 著者名/発表者名
  Jun Rekimoto
- 学会等名
  CHIuXID, 5th International ACM In-Cooperation HCI and UX Conference
- 関連する報告書
  2019 実績報告書
- 国際学会 / 招待講演
[学会発表] Human Augmentation(keynote)2019
- 著者名/発表者名
  Jun Rekimoto
- 学会等名
  ACM MobileHCI2019
- 関連する報告書
  2019 実績報告書
- 国際学会 / 招待講演
[学会発表] SottoVoce: An Ultrasound Imaging-Based Silent Speech Interaction Using Deep Neural Networks2019
- 著者名/発表者名
  Naoki Kimura, Michinari Kono, Jun Rekimoto
- 学会等名
  CHI '19: Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems
- 関連する報告書
  2019 実績報告書
- 国際学会
[備考] SottoVoce
- URL
  https://lab.rekimoto.org/projects/sottovoce/
- 関連する報告書
  2019 実績報告書
[学会・シンポジウム開催] Human Augmentation for Skill Acquisition and Skill Transfer2021
- 関連する報告書
  2021 実績報告書

深層学習による無音声発話インタラクションの研究

研究代表者

暦本 純一 東京大学, 大学院情報学環・学際情報学府, 教授 (20463896)

17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)

報告書

研究成果

[国際共同研究] Georgia Institute of Technology/college of computing(米国)

関連する報告書

[雑誌論文] SilentSpeller: Towards mobile, hands-free, silent speech text entry using electropalatography2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] JustSpeak: Automated, User-Configurable, Interactive Agents for Speech Tutoring2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Gaze+Lip: Rapid, Precise and Expressive Interactions Combining Gaze Input and Silent Speech Commands for Hands-free Smart TV Control2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Human Augmentation for Skill Acquisition and Skill Transfer2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] A Language Acquisition Support System that Presents Differences and Distances from Model Speech2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] SilentMask: Mask-type Silent Speech Interface with Measurement of Mouth Movement2021

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Derma: Silent Speech Interaction Using Transcutaneous Motion Sensing2021

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] TieLent: A Casual Neck-Mounted Mouth Capturing Device for Silent Speech Interaction2020

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] Human Augmentation and the future of Human-Computer Integration2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] Human Augmentation:人間の能力の拡張と進化2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] SottoVoce: 超音波画像と深層学習による無発声音声インタラクション2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] Homo Cyberneticus: The Era of Human-AI Integration2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] Human Augmentation and the future of Human-Computer Interactions2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] Human Augmentation(keynote)2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] SottoVoce: An Ultrasound Imaging-Based Silent Speech Interaction Using Deep Neural Networks2019

著者名/発表者名

学会等名

関連する報告書

[備考] SottoVoce

URL

関連する報告書

[学会・シンポジウム開催] Human Augmentation for Skill Acquisition and Skill Transfer2021

関連する報告書

暦本純一東京大学, 大学院情報学環・学際情報学府, 教授 (20463896)