2021 年度実績報告書

深層学習による無音声発話インタラクションの研究

研究課題

研究課題/領域番号	19H04148
研究機関	東京大学
研究代表者	暦本純一東京大学, 大学院情報学環・学際情報学府, 教授 (20463896)
研究期間 (年度)	2019-04-01 – 2022-03-31
キーワード	人間拡張 / ヒューマンコンピュータインタラクション / サイレントスピーチ / ウィスパースピーチ / Human-AI-Integration / 深層学習
研究実績の概要	音声認識は、コンピュータと人間の重要なインタラクション手段として利用できるようになったが、公共環境では他者の迷惑になったり、会話の秘匿性が担保できないなど利用環境に制限があった。有声ではなく発話を認識することができれば、インタラクション手段や発声困難者の会話支援技術として大きな可能性がある。今年度は、昨年度までに実施した各種のセンサーによるサイレント発話認識に加え、視線情報と口唇映像を融合するマルチモーダルインタラクション手法を提案・実現した。視線により認識すべきコマンドの語彙を制約することで、より高精度な発話認識を可能にする。また、視線インタフェースにおいて意図せざるコマンドの起動（ミダスタッチ問題）をサイレントスピーチをトリガーとすることで解決できる。本研究成果は、視線インタラクションの国際学会ETRA 2021にて発表した。また、whisper　voiceの深層学習による認識機構、whisper voice と通常の有声発話を弁別するインタフェースを提案・実現した。whisper voiceはサイレントスピーチに準ずる秘匿性・静寂性を持ち、通常のマイクロフォンでも認識可能であるなど有望な特徴を持つ。さらに、通常音声とwhisper voiceを区別することで、音声認識の訂正コマンドをwhisper voiceで発話するなどのマルチモード発話が可能になる。この研究成果はCHI2022で次年度に発表する予定である。本研究課題は、より根源的には人間の能力と人工知能の能力が実時間で結合することを意味する。これを従来のコンピュータと人間とのインタラクションを拡張する研究パラダイムとしてhumancomputer integrationあるいはhuman-AI integrationとし提唱し、CEDEC2021等での基調講演を通じて発信を行った。
現在までの達成度 (段落)	令和3年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和3年度が最終年度であるため、記入しない。

研究成果
(6件)

すべて 2022 2021

すべて雑誌論文 (5件) (うち国際共著 3件、査読あり 5件) 学会・シンポジウム開催 (1件)

[雑誌論文] SilentSpeller: Towards mobile, hands-free, silent speech text entry using electropalatography2022
- 著者名/発表者名
  Kimura Naoki、Gemicioglu Tan、Womack Jonathan、Li Richard、Zhao Yuhui、Bedri Abdelkareem、Su Zixiong、Olwal Alex、Rekimoto Jun、Starner Thad
- 雑誌名
  
  Proceedings of the ACM on Human-Computer Interaction
  
  巻: - ページ: 1-5
- DOI
  10.1145/3491102.3502015
- 査読あり / 国際共著
[雑誌論文] JustSpeak: Automated, User-Configurable, Interactive Agents for Speech Tutoring2021
- 著者名/発表者名
  Zhang Xinlei、Miyaki Takashi、Rekimoto Jun
- 雑誌名
  
  Proceedings of the ACM on Human-Computer Interaction
  
  巻: 5 ページ: 1～24
- DOI
  10.1145/3459744
- 査読あり / 国際共著
[雑誌論文] Gaze+Lip: Rapid, Precise and Expressive Interactions Combining Gaze Input and Silent Speech Commands for Hands-free Smart TV Control2021
- 著者名/発表者名
  Su Zixiong、Zhang Xinlei、Kimura Naoki、Rekimoto Jun
- 雑誌名
  
  ETRA21 ACM Symposium on Eye Tracking Research and Applications
  
  巻: - ページ: 1-6
- DOI
  10.1145/3448018.3458011
- 査読あり / 国際共著
[雑誌論文] Human Augmentation for Skill Acquisition and Skill Transfer2021
- 著者名/発表者名
  Koike Hideki、Rekimoto Jun、Ushiba Junichi、Furuya Shinichi、Ito Asa
- 雑誌名
  
  Proceedings of the ACM on Human-Computer Interaction
  
  巻: - ページ: 1-3
- DOI
  10.1145/3411763.3441354
- 査読あり
[雑誌論文] A Language Acquisition Support System that Presents Differences and Distances from Model Speech2021
- 著者名/発表者名
  Kawamura Kazuki、Rekimoto Jun
- 雑誌名
  
  UIST '21: The Adjunct Publication of the 34th Annual ACM Symposium on User Interface Software and Technology
  
  巻: - ページ: 44-46
- DOI
  10.1145/3474349.3480225
- 査読あり
[学会・シンポジウム開催] Human Augmentation for Skill Acquisition and Skill Transfer2021

2021 年度 実績報告書

深層学習による無音声発話インタラクションの研究

研究代表者

暦本 純一 東京大学, 大学院情報学環・学際情報学府, 教授 (20463896)

研究成果

[雑誌論文] SilentSpeller: Towards mobile, hands-free, silent speech text entry using electropalatography2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] JustSpeak: Automated, User-Configurable, Interactive Agents for Speech Tutoring2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Gaze+Lip: Rapid, Precise and Expressive Interactions Combining Gaze Input and Silent Speech Commands for Hands-free Smart TV Control2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Human Augmentation for Skill Acquisition and Skill Transfer2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] A Language Acquisition Support System that Presents Differences and Distances from Model Speech2021

著者名/発表者名

雑誌名

DOI

[学会・シンポジウム開催] Human Augmentation for Skill Acquisition and Skill Transfer2021

2021 年度実績報告書

暦本純一東京大学, 大学院情報学環・学際情報学府, 教授 (20463896)