携帯機器向けの手書き文字の準同期入力を併用した音声認識手法の研究

研究課題

研究課題/領域番号	15300054
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	知覚情報処理・知能ロボティクス
研究機関	東京工業大学
研究代表者	篠田浩一東京工業大学, 情報理工学研究科, 助教授 (10343097)
研究分担者	古井貞熙 (古井貞煕) 東京工業大学, 情報理工学研究科, 教授 (90293076)
研究期間 (年度)	2003 – 2004
研究課題ステータス	完了 (2004年度)
配分額 *注記	5,900千円 (直接経費: 5,900千円) 2004年度: 3,100千円 (直接経費: 3,100千円) 2003年度: 2,800千円 (直接経費: 2,800千円)
キーワード	音声認識 / マルチモーダルインタフェース / 手書き文字認識 / サーチアルゴリズム / マン-マシンインタフェース / 携帯機器 / 隠れマルコフモデル / 情報携帯端末 / 携帯情報端末
研究概要	携帯情報機器における使いやすく、かつ、頑健な入力インターフェースが求められている。本研究課題では、「書きながら話す、話しながら書く、入力インターフェース」の実現を目指した。音声入力のみより周囲雑音に対し頑健で、手書き文字入力のみより高速な入力が可能となることが期待できる。そのために、本研究課題の研究期間内では、特にメール文などの自由文入力を想定し、音声入力と手書き文字入力との同時入力を統合して認識する手法を開発した。初年度は、速度の異なる2入力を用いた、使いやすく、かつ、それぞれの単独入力よりも高性能が期待できる形態として、文節の先頭ひらがな文字を手書き文字で入力するインターフェースを提案した。また、そのためのオンライン手書き文字入力方式を実装した。そして、同時入力に対する認識アルゴリズムを考案し、音声と手書き文字とを別々に収録したデータベースを用いてシミュレーション実験を行い、その有効性を確認した。最終年度は、提案したインターフェースを実装した収録システムを構築し、被験者10名の計530文のデータを収録し、認識性能評価を行った。探索方式は、まず、音声のみを用いた認識で認識結果候補を単語グラフの形で出力し、次に、音声スコアと手書き文字スコアを同時に用いてグラフ探索を行う2パス処理を用いた。あわせて音声と手書き文字の入力のずれに対し適応する方式も採用した。音声のみの認識結果に比べ、話者平均で5%程度認識性能が向上し、提案手法の効果を確認した。今後は、音声と手書き文字の間の重みの自動最適化などのアルゴリズム改良を行い、実時間で動作するシステムを実装する。また、インターフェースとしての使いやすさの評価、他の入力形態の検討を行う。さらに本手法は雑音下で特に有用と考えられるため、実環境下での評価も行いたい。

報告書

(3件)

2004 実績報告書研究成果報告書概要
2003 実績報告書

研究成果
(5件)

すべて 2005 2004 その他

すべて雑誌論文 (4件) 文献書誌 (1件)

[雑誌論文] 音声と手書き文字の同時入力インターフェース2005
- 著者名/発表者名
  中川, 小林(唯), 小林(隆), 篠田, 古井
- 雑誌名
  
  2005年電子情報通信学会技術研究報告 2005年5月(印刷中)
- NAID
  110002950654
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2004 研究成果報告書概要
[雑誌論文] Simultaneous Input Interface of Speech and Handwritten Characters2005
- 著者名/発表者名
  R.Nakagawa, Y.Kobayashi, R.Kobayashi, K.Shinoda, S.Furui
- 雑誌名
  
  Technical Report of IEICE vol.SP2005-5(in press)
- NAID
  110002950654
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2004 研究成果報告書概要
[雑誌論文] 手書き文字の準同期入力を併用した音声認識手法の予備検討2004
- 著者名/発表者名
  市屋, 中川, 篠田, 古井
- 雑誌名
  
  2004年電子情報通信学会総合大会講演論文集 D
  
  ページ: 148-148
- NAID
  110003263600
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2004 実績報告書 2004 研究成果報告書概要
[雑誌論文] Preliminary Evaluation of Speech Recognition with Quasi-Synchronous Input of Hand-Written Characters.2004
- 著者名/発表者名
  T.Ichiya, R.Nakagawa, K.Shinoda, S.Furui
- 雑誌名
  
  Proc.Of 2004 IEICE General Conference vol.D
  
  ページ: 148-148
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2004 研究成果報告書概要
[文献書誌] 市屋, 中川, 篠田, 古井: "手書き文字の準同期入力を併用した音声認識手法の予備検討"2004年電子情報通信学会総合大会講演論文集. D. 148-148 (2004)
- 関連する報告書
  2003 実績報告書

携帯機器向けの手書き文字の準同期入力を併用した音声認識手法の研究

研究代表者

篠田 浩一 東京工業大学, 情報理工学研究科, 助教授 (10343097)

5,900千円 (直接経費: 5,900千円)

報告書

研究成果

[雑誌論文] 音声と手書き文字の同時入力インターフェース2005

著者名/発表者名

雑誌名

NAID

説明

関連する報告書

[雑誌論文] Simultaneous Input Interface of Speech and Handwritten Characters2005

著者名/発表者名

雑誌名

NAID

説明

関連する報告書

[雑誌論文] 手書き文字の準同期入力を併用した音声認識手法の予備検討2004

著者名/発表者名

雑誌名

NAID

説明

関連する報告書

[雑誌論文] Preliminary Evaluation of Speech Recognition with Quasi-Synchronous Input of Hand-Written Characters.2004

著者名/発表者名

雑誌名

説明

関連する報告書

[文献書誌] 市屋, 中川, 篠田, 古井: "手書き文字の準同期入力を併用した音声認識手法の予備検討"2004年電子情報通信学会総合大会講演論文集. D. 148-148 (2004)

関連する報告書

篠田浩一東京工業大学, 情報理工学研究科, 助教授 (10343097)