• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実施状況報告書

マルチモーダルインタラクションに向けた音声画像融合計測インタフェースの応用開発

研究課題

研究課題/領域番号 24560523
研究種目

基盤研究(C)

研究機関熊本大学

研究代表者

緒方 公一  熊本大学, 自然科学研究科, 准教授 (10264277)

研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード信号処理 / 音声合成
研究概要

本研究は,音声および画像の融合による合成・計測インタフェース開発を目的として,申請者が得意としこれまで行ってきた生成過程に基づく音声合成技術と,3 次元計測データ解析技術,視線検出インタフェースよるデータ解析技術等をさらに発展進化させることで,制御,相互補完技術や,補助システムなどの,マルチモーダル・インタフェースの開発を目指するものである。調音に基づく音声合成の実用化など,個々の要素技術も進化させながら,トータルシステムとしてのインタフェース応用展開を目指している。
マウスのワンクリックで声道音響管の生成が可能なマッピングンタフェース開発においては,本来音声生成に関与しない指鼻試験における指先の動きを入力信号として母音を生成するコンバータとしての可能性の研究をさらに進めた。指先の周期的な運動をインタフェース上に投影し,そのパターンにより音韻を変える方法,入力信号を音声のピッチパターンに対応させる方法などを検討し,結果としての合成音声信号から変換元の信号の様態を判別できることを明らかにした。データグローブを用いて声道音響管を生成し母音を合成する方式について,効果的な制御方法を検討し,3本の指で5母音を生成できることを明らかにした。また,視線検出インタフェースの開発研究では,システム利用時の被験者の頭部位置移動に対するロバスト性の向上のための方法について検討し,直接的に移動量を検出しない方法を実現した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

マッピングインタフェース開発,データグローブによる母音合成,視線検出インタフェースのロバスト化など,それぞれの開発研究が進行し,それぞれの研究経過は,国際学会論文や国内講演発表として報告されている。それぞれのテーマで進展が見られ,その成果に基づいた応用展開,融合展開のテーマも新たに創出される状況となっており,本研究課題はおおむね順調に推移しているといえる。

今後の研究の推進方策

○マッピングインタフェース上の軌跡情報活用のためのシステム改変,
○視線を介した音声合成システム開発,
○融合システムによる環境情報推定装置の開発と評価,
を主項目として実施する予定である。
マッピングインタフェース上の軌跡情報活用のためのシステム改変では,音声から声道音響管の形状を逆推定する手法について検討し,軌跡情報の特性を踏まえた応用展開を目指す。視線を介した音声合成システム開発の実施にあたっては,ロバスト性に関する研究結果に基づいて視線検出システムのデザインを改良する。このために,視線検出システムと音声合成システムとの親和性の高い接続のためインタフェース部を作成する。また,視線による物体の運動制御のような応用展開を視野に研究を進める。

次年度の研究費の使用計画

該当なし

  • 研究成果

    (9件)

すべて 2013 2012 その他

すべて 雑誌論文 (4件) (うち査読あり 3件) 学会発表 (5件)

  • [雑誌論文] Improvement of a vocal tract shape setting tool using a data glove2013

    • 著者名/発表者名
      Kohei Matsumura
    • 雑誌名

      Proceedings of the Youngnam-Kyushu Joint Conference on Acoustics 2013

      ページ: No.209

    • 査読あり
  • [雑誌論文] Semi-dynamic calibration for eye gaze pointing system based on image processing2012

    • 著者名/発表者名
      Kohichi Ogata
    • 雑誌名

      Proceedings of International Conference on Signal Processing and Multimedia Applications (SIGMAP 2012)

      ページ: 233-236

    • 査読あり
  • [雑誌論文] One-click vocal tract mapping interface for vowels and its usefulness as a signal converter2012

    • 著者名/発表者名
      Kohichi Ogata
    • 雑誌名

      Proceedings of The 2012 IEEE International Conference on Signal Processing,Communications and Computing (ICSPCC2012)

      ページ: 602-607

    • DOI

      10.1109/ICSPCC.2012.6335640

    • 査読あり
  • [雑誌論文] ワンクリック声道音響管マッピングインタフェースの開発とその信号変換への応用2012

    • 著者名/発表者名
      緒方公一
    • 雑誌名

      電子情報通信学会技術研究報告 SP2012-81

      巻: 112 ページ: 55-60

  • [学会発表] ラジオコントロールカーの視線制御に関する検討

    • 著者名/発表者名
      正尺宏樹
    • 学会等名
      第11回情報科学技術フォーラム
    • 発表場所
      法政大学(東京都)
  • [学会発表] 視線インタフェースのための頭部位置認識機構の検討

    • 著者名/発表者名
      緒方公一
    • 学会等名
      第11回情報科学技術フォーラム
    • 発表場所
      法政大学(東京都)
  • [学会発表] 成長曲線を考慮した声道音響管デザインツールの開発

    • 著者名/発表者名
      伊藤大輔
    • 学会等名
      日本音響学会2012年秋季研究発表会
    • 発表場所
      信州大学(長野県)
  • [学会発表] 声道形状マッピングインタフェースを用いた運動パターンの音声化 ― ピッチ周波数を利用した運動パターンの表現

    • 著者名/発表者名
      山下健太郎
    • 学会等名
      平成24年度電気関係学会九州支部連合大会
    • 発表場所
      長崎大学(長崎県)
  • [学会発表] データグローブを用いた声道音響管生成と音声合成

    • 著者名/発表者名
      緒方公一
    • 学会等名
      日本音響学会2013年春季研究発表会
    • 発表場所
      東京工科大学(東京都)

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi