• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

口唇の特徴を用いた屋内作業業務の効率化支援システムに関する研究

研究課題

研究課題/領域番号 21J15592
研究種目

特別研究員奨励費

配分区分補助金
応募区分国内
審査区分 小区分61010:知覚情報処理関連
研究機関秋田大学

研究代表者

中村 悦郎  秋田大学, 理工学研究科, 特別研究員(DC2)

研究期間 (年度) 2021-04-28 – 2023-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
1,500千円 (直接経費: 1,500千円)
2021年度: 800千円 (直接経費: 800千円)
キーワード口唇 / 発話区間抽出 / 発話者判別 / 読唇 / 議事録 / Long-short term memory / MFCC / 全方位カメラ
研究開始時の研究の概要

音声認識技術に基づいた議事録自動作成システムを使用することは,会議における議事録作成業務の効率化に寄与すると考える.特に,自動取得された議事録に対して発言者を自動で割り振る機能,および音声認識結果の誤りを補正する機能は,議事録作成業務の効率化に寄与すると考える.
本研究では,利便性の高い議事録自動作成システムの構築を目的とする.全方位カメラを用いて取得した口唇の動きおよび音声情報を用いて「発話者判別手法」および「音声認識結果の補正手法」に関する検討を行う.

研究実績の概要

今年度,発話者判別機能を搭載した議事録自動作成システムの構築を目的とし,各要素技術の実用性を考慮して検討を加えた.具体的には,①発話区間抽出手法,②発話者判別手法,ならびに③発話内容推定手法における各種課題に対して検討を加えた.①の検討では,6名の被験者が2名1組で1分間会話をしている様子を全方位カメラおよびマイクを用いて撮影し,これらのデータを対象として発話区間抽出手法の実用性に関する評価を行った.このとき,発話区間抽出に使用する閾値の算出式に対して新たな係数を加えて検討した.この結果,評価指標であるF-measureの平均値が0.07向上すること,音読時と会話時において口唇の動きに異なる傾向があることを示唆する結果を得た.②の検討では,Long-short term memory(以降,LSTMと略記する)を用いた発話者判別手法において,使用する特徴量の選定を行った.検討には,被験者14名が11文を発話した動画データを使用した.この結果,選定した音声の特徴量および口唇の縦幅と横幅の長さに基づいた特徴量を発話者判別のために使用することは,発話者判別成功率の向上に寄与することを明らかにした.また,発話者判別成功率は最大で93.0%,平均で87.2%の値が得られ,提案した発話者判別手法の有用性を明らかにした.③の検討において,発声に伴う顔の部位の動きとLSTMを用いて,発声した音節を推定する手法について検討を加えた.検討には,被験者14名が11文を発話した動画データ,および被験者15名が50文を発話した動画データを使用した.検討の結果,相関係数を用いて選定された口唇の動きの特徴量は,音節の判別に有用であること,かつ口唇の動きに加えて顎の動きを使用することは,音節推定精度の向上に寄与することを明らかにした.

現在までの達成度 (段落)

翌年度、交付申請を辞退するため、記入しない。

今後の研究の推進方策

翌年度、交付申請を辞退するため、記入しない。

報告書

(1件)
  • 2021 実績報告書
  • 研究成果

    (8件)

すべて 2022 2021 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (5件) (うち国際学会 2件) 備考 (1件)

  • [雑誌論文] LSTM-based Japanese Speaker Identification Using an Omnidirectional Camera and Voice Information2022

    • 著者名/発表者名
      E. Nakamura, Y. Kageyama, S. Hirose
    • 雑誌名

      IEEJ Transactions on Electrical and Electronic Engineering

      巻: 17 号: 5 ページ: 674-684

    • DOI

      10.1002/tee.23555

    • 関連する報告書
      2021 実績報告書
    • 査読あり
  • [雑誌論文] Japanese Syllable Estimation using Lip and Chin Movements2022

    • 著者名/発表者名
      E. Nakamura,Y. Honda,Y. Kageyama,S. Hirose
    • 雑誌名

      IEEJ Transactions on Electrical and Electronic Engineering

      巻: 17

    • 関連する報告書
      2021 実績報告書
    • 査読あり
  • [学会発表] Facial Feature Points for Japanese Speech Content Estimation2022

    • 著者名/発表者名
      E. Nakamura,Y. Honda,Y. Kageyama,S. Hirose
    • 学会等名
      2022 IEEE 4th Global Conference on Life Sciences and Technologies
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] 全方位カメラを用いた発話者判別手法における音声特徴量に関する検討2021

    • 著者名/発表者名
      中村悦郎,景山陽一,廣瀬聡
    • 学会等名
      2021年度電気関係学会東北支部連合大会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 発話内容の判別を目的とした口唇の動きの変化解析2021

    • 著者名/発表者名
      中村悦郎,本田悠将,景山陽一,廣瀬聡
    • 学会等名
      第37回 ファジィシステムシンポジウム
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Application of Speech Section Extraction Method Using Lip and Voice2021

    • 著者名/発表者名
      E. Nakamura,Y. Kageyama,S. Hirose
    • 学会等名
      The 9th International Conference on Materials Engineering for Resources
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] 発話に伴う口唇特徴点の動きと音素との関連性に関する解析2021

    • 著者名/発表者名
      中村悦郎,本田悠将,景山陽一,廣瀬聡
    • 学会等名
      映像情報メディア学会2021年冬季大会
    • 関連する報告書
      2021 実績報告書
  • [備考] 秋田大学 景山研究室ホームページ

    • URL

      https://adeos6.ie.akita-u.ac.jp/

    • 関連する報告書
      2021 実績報告書

URL: 

公開日: 2021-05-27   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi