• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Social Expression for Dialogue Robots with focus on Individuality

Publicly Offered Research

Project AreaStudies on intelligent systems for dialogue toward the human-machine symbiotic society
Project/Area Number 22H04875
Research InstitutionAdvanced Telecommunications Research Institute International

Principal Investigator

石井 カルロス寿憲  株式会社国際電気通信基礎技術研究所, 石黒浩特別研究所, グループリーダー (30418529)

Project Period (FY) 2022-04-01 – 2024-03-31
Keywords音声情報処理 / 非言語情報処理 / パラ言語情報処理 / 人ロボットインタラクション / 音環境知能
Outline of Annual Research Achievements

本研究では、発話に伴う、人間らしい自然な話し方と振る舞い方を持つ対話ロボット・エージェントを実現する。特に、状況や対話相手を認識し、それらに応じて発話に伴う、人間らしい話し方と振る舞い方を、個人性も考慮したうえで表出可能な対話ロボット・エージェントを実現することを目的としている。
複数人とインタラクションする対話ロボットの視線動作生成に関する研究においては、人同士のマルチモーダル対話データから視線逸らしの時間や黒目の向きなどの分布パラメータを学習し、ロボットの視線制御を行った。また、これらの分布パラメータを変えることによって、外向性の印象を変えることができる仮説を小型ロボットCommUおよびアンドロイドNikolaを用いて被験者実験を通して検証した。
条件付きGANモデルによる手振りと上半身の動作を生成する手法を提案し、条件に動きの大きさと速さによって分割したデータでモデルを学習することにより、3段階で動きを生成することができ、それが外向性の印象を明示的に制御できることを、被験者実験を通して確認した。
状況認識においては、深層学習による感情音声認識の研究を進め、隠れ表現へのレギュレーションによる、学習コーパスにオーバーフィットしにくいロバストな学習法を提案した。
自然会話に出現する自発的な「楽しい笑い」と社会的な「愛想笑い」の音声特徴の分析にも取り組んできた。対話ロボットの笑いの適切な表出および相手の笑いの意図の理解は、自然な対話インタラクションに重要な課題である。笑いには個人性と社会的機能によって音声特性が変わる。楽しい笑いには話者間で共通したパターンが観測された一方、愛想笑いには、強い気息音を含む、気息音を全く含まない、鼻音を含むなど、話者によって表出のバリエーションが多い傾向がみられた。この成果は日本音響学会関西支部の若手研究会で注目を浴び、最優秀奨励賞を受賞した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

複数の角度から社会的表出の実現に向けた研究に取り組んでおり、論文誌2件、査読付きの国際会議論文5件と、それぞれの成果も順調にアウトプットされており、研究は順調に進んでいる。

Strategy for Future Research Activity

次年度の研究の推進方策として、各項目において、モデルの改善を試み、モデルの効果を検証して論文誌にまとめる予定である。
視線動作生成においては、外向性の印象は音声によって大きく変化するため、発話スタイルと視線動作のバランスによって外向性の印象がどのように変わるかは今後の課題である。
条件付きGANモデルによる手振りと上半身の動作を生成においては、生成された動きがより滑らかになるようにdiffuse denoising model による深層学習法も試みる予定である。
状況認識においては、ロボットの対話相手の感情を認識することにより、それに同調したロボットの感情表出を可能にする。
自然会話に出現する笑いの分析においては、音響的特徴も分析し、自発的な楽しい笑いと社会的な意図的笑いの違いを明らかにし、対話ロボットのインタラクションに活用する予定である。

  • Research Products

    (16 results)

All 2023 2022

All Journal Article (7 results) (of which Peer Reviewed: 7 results,  Open Access: 2 results) Presentation (9 results) (of which Int'l Joint Research: 6 results,  Invited: 3 results)

  • [Journal Article] An attention-based sound selective hearing support system: evaluation by subjects with age-related hearing loss2023

    • Author(s)
      Ishi Carlos T.、Liu Chaoran、Minato Takashi
    • Journal Title

      Proc. SII2023

      Volume: - Pages: 1-6

    • DOI

      10.1109/SII55687.2023.10039165

    • Peer Reviewed
  • [Journal Article] An improved CycleGAN-based emotional voice conversion model by augmenting temporal dependency with a transformer2022

    • Author(s)
      Fu Changzeng、Liu Chaoran、Ishi Carlos Toshinori、Ishiguro Hiroshi
    • Journal Title

      Speech Communication

      Volume: 144 Pages: 110~121

    • DOI

      10.1016/j.specom.2022.09.002

    • Peer Reviewed / Open Access
  • [Journal Article] An Adversarial Training Based Speech Emotion Classifier with Isolated Gaussian Regularization2022

    • Author(s)
      Fu Changzeng、Liu Chaoran、Ishi Carlos、Ishiguro Hiroshi
    • Journal Title

      IEEE Transactions on Affective Computing

      Volume: - Pages: 1~1

    • DOI

      10.1109/TAFFC.2022.3169091

    • Peer Reviewed
  • [Journal Article] C-CycleTransGAN: A Non-parallel Controllable Cross-gender Voice Conversion Model with CycleGAN and Transformer2022

    • Author(s)
      Fu Changzeng、Liu Chaoran、Ishi Carlos Toshinori、Ishiguro Hiroshi
    • Journal Title

      Proc. APSIPA 2022

      Volume: - Pages: 1-7

    • DOI

      10.23919/APSIPAASC55919.2022.9979821

    • Peer Reviewed
  • [Journal Article] Controlling the Impression of Robots via GAN-based Gesture Generation2022

    • Author(s)
      Wu Bowen、Shi Jiaqi、Liu Chaoran、Ishi Carlos T.、Ishiguro Hiroshi
    • Journal Title

      Proc. IROS22

      Volume: - Pages: 9288-9295

    • DOI

      10.1109/IROS47612.2022.9981535

    • Peer Reviewed
  • [Journal Article] Expression of Personality by Gaze Movements of an Android Robot in Multi-Party Dialogues2022

    • Author(s)
      Shintani Taiken、Ishi Carlos Toshinori、Ishiguro Hiroshi
    • Journal Title

      Proc. RO-MAN22

      Volume: - Pages: 1534-1541

    • DOI

      10.1109/RO-MAN53752.2022.9900812

    • Peer Reviewed
  • [Journal Article] Prosodic and Voice Quality Analyses of Filled Pauses in Japanese Spontaneous Conversation by Chinese learners and Japanese Native Speakers2022

    • Author(s)
      Li Xinyue、Ishi Carlos Toshinori、Fu Changzeng、Hayashi Ryoko
    • Journal Title

      Proc. Speech Prosody 2022

      Volume: - Pages: 550-554

    • DOI

      10.21437/SpeechProsody.2022-112

    • Peer Reviewed / Open Access
  • [Presentation] An attention-based sound selective hearing support system: evaluation by subjects with age-related hearing loss2023

    • Author(s)
      C.T. Ishi, C. Liu, T. Minato
    • Organizer
      2023 IEEE/SICE International Symposium on System Integration (SII)
    • Int'l Joint Research
  • [Presentation] マルチモーダル音声情報処理と対話ロボットへの応用2023

    • Author(s)
      石井カルロス寿憲
    • Organizer
      富山県立大学 特別講義I
    • Invited
  • [Presentation] C-CycleTransGAN: A Non-Parallel Controllable Cross-Gender Voice Conversion Model With CycleGAN and Transformer2022

    • Author(s)
      C. Fu, C. Liu, C. T. Ishi, H. Ishiguro
    • Organizer
      2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • Int'l Joint Research
  • [Presentation] Controlling the Impression of Robots via GAN-based Gesture Generation2022

    • Author(s)
      B. Wu, J. Shi, C. Liu, C.T. Ishi, H. Ishiguro
    • Organizer
      2022 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)
    • Int'l Joint Research
  • [Presentation] Expression of Personality by Gaze Movements of an Android Robot in Multi-Party Dialogues2022

    • Author(s)
      T. Shintani, C.T. Ishi, H. Ishiguro
    • Organizer
      2022 31st IEEE International Conference on Robot and Human Interactive Communication (RO-MAN)
    • Int'l Joint Research
  • [Presentation] Prosodic and Voice Quality Analyses of Filled Pauses in Japanese Spontaneous Conversation by Chinese learners and Japanese Native Speakers2022

    • Author(s)
      X. Li, C.T. Ishi, C. Fu, R. Hayashi
    • Organizer
      Speech Prosody 2022
    • Int'l Joint Research
  • [Presentation] Analysis and generation of speech-related motions, and evaluation in humanoid robots2022

    • Author(s)
      C.T. Ishi
    • Organizer
      ICMI GENEA (Generation and Evaluation of Non-verbal Behaviour for Embodied Agents) Workshop 2022
    • Int'l Joint Research / Invited
  • [Presentation] 声質の科学:音響特徴、EGG特性およびパラ言語的機能2022

    • Author(s)
      石井カルロス寿憲
    • Organizer
      日本音響学会 音声研究会 (ASJ-SP)
    • Invited
  • [Presentation] 自由会話における「楽しい笑い」と「愛想笑い」の音声的特徴ー予備的分析2022

    • Author(s)
      王可心、石井カルロス寿憲、林良子
    • Organizer
      日本音響学会第25回関西支部若手研究者交流研究発表会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi