2010 年度実績報告書

聴覚障害者のコミュニケーション支援のための読唇による会話認識インタフェースの開発

研究課題

研究課題/領域番号	21700582
研究機関	九州工業大学
研究代表者	齊藤剛史九州工業大学, 大学院・情報工学研究院, 准教授 (10379654)
キーワード	読唇システム / コミュニケーション支援 / 聴覚障害者
研究概要	本研究課題では,機械読唇を利用した聴覚障害者のコミュニケーション支援を目的として,単音や単語だけでなく会話文をリアルタイムで認識するインタフェースの開発を目指す.本研究2年度の平成22年度は以下のことに取り組んだ. 1)研究実施計画に基づき,文章発話シーンとして5人より新聞記事29文の発話シーンを撮影した. 2)研究実施計画に基づき,文章発話シーンに対して連続DPマッチングを用いたスポッティング認識を適用した.新聞記事29文の中から出現頻度の高い16語を認識対象に設定した.5人の発話シーンに対して実験を行った結果,平均認識率は46%であった.文章発話シーンは単語発話シーンに比べると口の開閉が小さい.そこで認識率が低い原因を解明するため,認識対象16語に対して単語認識を行った.その結果85%の認識率を得た.この結果より,口の開閉でなく,スポッティング認識の手法に問題があることが判明した. 3)2の問題を踏まえ文章認識でなく単語認識を利用したコミュニケーション支援システムの開発を目的とし,リアルタイム単語認識システムの開発に取り組んだ,以前のシステムは顔の下半分の画像を用いていたた,め,利用する際,発話者に負担を強いていた.そこで昨年度の提案した手法を組み込んだ,会話文50文を認識対象とし,1回の施行につき全50文を1回ずつ発話する認識実験を5回試行した.その結果,50文で平均認識率は80.6%,平均処理時間は15.4fps,発話終了後から認識結果を表示する前での平均時間は83.6秒であった.リアルタイム性を確認した. 4)研究成果は学術論文1件,国際会議2件,国内学会3件で発表した.

研究成果
(7件)

すべて 2011 2010

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (5件) 産業財産権 (1件)

[雑誌論文] 発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇2011
- 著者名/発表者名
  齊藤剛史, 森下和敏, 小西亮介
- 雑誌名
  
  電気学会論文誌
  
  巻: 131 ページ: 418-424
- 査読あり
[学会発表] 口形認識に有効な視点の検討2010
- 著者名/発表者名
  齊藤剛史
- 学会等名
  第15回パターン計測シンポジウム
- 発表場所
  デュープレックスセミナーホテル(茨木県)
- 年月日
  20101203-20101204
[学会発表] 連続DPマッチングを用いた発話シーンからの単語スポッティング認識2010
- 著者名/発表者名
  齊藤剛史
- 学会等名
  電子情報通信学会パターン認識・メディア理解研究会
- 発表場所
  幕張メッセ(千葉県)
- 年月日
  20101008-20101009
[学会発表] A study of influence of word lip reading by change of frame rate2010
- 著者名/発表者名
  Takeshi Saitoh
- 学会等名
  9^<th> International Conference on Auditory-Visual Speech Processing
- 発表場所
  プリンス箱根(神奈川県)
- 年月日
  20100930-20101003
[学会発表] Profile Lip Reading for Vowel and Word Recognition2010
- 著者名/発表者名
  Takeshi Saitoh
- 学会等名
  20^<th> International Conference on Pattern Recognition
- 発表場所
  Istanbul Convention & Exhibition Centre (トルコ)
- 年月日
  20100823-20100826
[学会発表] フレームレート変化による単語読唇の影響に関する考察2010
- 著者名/発表者名
  齊藤剛史
- 学会等名
  第13回画像の認識・理解シンポジウム
- 発表場所
  釧路市観光国際交流センター(北海道)
- 年月日
  20100727-20100729
[産業財産権] ワードスポッティング読唇及び方法2010
- 発明者名
  齊藤剛史
- 権利者名
  齊藤剛史
- 産業財産権番号
  特許、特願2010-201629
- 出願年月日
  2010-09-09

2010 年度 実績報告書

聴覚障害者のコミュニケーション支援のための読唇による会話認識インタフェースの開発

研究代表者

齊藤 剛史 九州工業大学, 大学院・情報工学研究院, 准教授 (10379654)

研究成果

[雑誌論文] 発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇2011

著者名/発表者名

雑誌名

[学会発表] 口形認識に有効な視点の検討2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 連続DPマッチングを用いた発話シーンからの単語スポッティング認識2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] A study of influence of word lip reading by change of frame rate2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Profile Lip Reading for Vowel and Word Recognition2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] フレームレート変化による単語読唇の影響に関する考察2010

著者名/発表者名

学会等名

発表場所

年月日

[産業財産権] ワードスポッティング読唇及び方法2010

発明者名

権利者名

産業財産権番号

出願年月日

2010 年度実績報告書

齊藤剛史九州工業大学, 大学院・情報工学研究院, 准教授 (10379654)