研究課題/領域番号 |
23K11204
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61020:ヒューマンインタフェースおよびインタラクション関連
|
研究機関 | 東京電機大学 |
研究代表者 |
斎藤 博人 東京電機大学, システムデザイン工学部, 教授 (00328519)
|
研究分担者 |
武川 直樹 東京電機大学, システムデザイン工学部, 研究員 (20366397)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2025年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2023年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | 話速変換 / 聴覚フィードバック / 発話速度 / 遠隔 / 会話システム |
研究開始時の研究の概要 |
本研究は周囲とのコミュニケーションに意欲をもちつつも,聞き取り能力の問題により会話に取り残されがちな人が,ゆっくりとした再生で受聴することにより会話の場に加わることを支援するものである. 音声の高さを保ったままゆっくりと再生する手法は話速変換技術が有効だが,会話に適用した場合,音声遅延が生じるため会話のやりとりがしにくくなる問題があった.ゆっくりとした再生の支援が必要ない話し手も遅延を違和感なく許容でき,会話に参加する全ての人に公平な会話機会がある会話環境を構築する.
|
研究実績の概要 |
令和5年度の研究計画では、以下の2つを設定していた。 (1) 聴覚フィードバックの再生方法の検討(音圧、加工、再生長) (2) 聴覚フィードバックと視覚フィードバックの同時利用をする会話の収録 上記に加え、(3)「聴取する音声の速さが一定になる話速変換処理における音声の聞き取りやすさの評価」にも関連課題として取り組んだ。各成果を報告する。(1) 話速変換を用いた会話での話し手への残余発話聴取時間を聴覚フィードバックで呈示する手法を評価した。これは従来法の課題であった自分の音声を聴取する不快感を解消した上で、相手の聴取完了地点を予測できる聴覚でのフィードバック手法の狙うものである。実験では、4種類のフィードバック音の評価を行った。結果として、再生BPMを変化させるフィードバックが従来の伸長音声を流すフィードバックと同等の精度があることを明らかにした。(2) 聴覚フィードバックと視覚フィードバックの同時利用条件での会話の収録は未実施である。令和5年度は「聴覚フィードバック」と「視覚フィードバック」を独立して使用する実験とその分析に時間を要したため、同時利用の実験は、今年度以降に実施する。 (3) 話し手の発話速度に応じて発話伸長率をリアルタイムに変更し、聞き手の聴取する音声の速さが一定となるような話速変換方式(伸長率変動方式)を提案し、音声の聞き取りやすさに与える影響を調査した。分析結果より、聞き取りやすい音声を実現するための発話伸長率の制御手法に関する調査を行い、過去3発話の平均を参照することが有効であることが明らかにした。本研究課題の成果の一部は、2024年3月国際会議、HCS研究会、NCSP24にて公表した。これらの成果は2023年度に採択された課題番号23K11204にも引き継いでいる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
計画していた聴覚フィードバックと視覚フィードバックの同時利用条件での会話の収録は未実施となったが、これは、事前に「聴覚フィードバック」と「視覚フィードバック」を独立して使用する実験を詳細(雑談対話、説明対話)に新たに収録し、その分析に時間を要したためである。追加の課題にも新たに取り組み始めたので全体としては順調に進展している。
|
今後の研究の推進方策 |
令和6年度は計画どおり、会話分析の結果を反映したフィードバック生成モデルの実装に取り組む。また「聴覚フィードバック」と「視覚フィードバック」を会話の種類や話し手の発話量に応じて適応的に切り替える機能を実現する検討に着手する。 視覚フィードバック」の利点は、話し手が発話中でも、聞き手との時間差を把握できることである。この利点を「聴覚フィードバック」のみでも実現できるよう、聴覚フィードバックにおける呈示音とそのタイミングについて検討する。
|