2010 年度研究成果報告書

ヒューマンコミュニケーション検索・要約のためのマルチモーダル認識の研究

研究課題

研究課題/領域番号	20300063
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	知覚情報処理・知能ロボティクス
研究機関	東京工業大学
研究代表者	篠田浩一東京工業大学, 大学院・情報理工学研究科, 准教授 (10343097)
研究分担者	古井貞熙東京工業大学, 大学院・情報理工学研究科, 教授 (90293076)
研究期間 (年度)	2008 – 2010
キーワード	音声認識 / 動画像認識 / マルチモーダル認識 / ヒューマンコミュニケーション理解 / 情報検索
研究概要	ヒューマンコミュニケーション理解のために、音声・動画から構成されるマルチメディアデータに対するマルチモーダルパターン認識技術を開発した。まず映像におけるイベントの抽出では混合ガウス分布とサポートベクターマシンを用いた統計的手法を提案し、世界40機関が参加して開催されたTRECVID2010ワークショップで世界4位(日本からの参加者中では1位)の成果を得た。また、音声モデルの能動学習・能動適応、耐雑音音声認識、ミーティング音声認識のための信号処理、マルチモーダル認識アルゴリズム、話者認識・ジェスチャー認識、発話スタイル解析、映像要約の手法をそれぞれ開発した。

研究成果
(38件)

すべて 2011 2010 2009 2008 その他

すべて雑誌論文 (4件) (うち査読あり 4件) 学会発表 (33件) 備考 (1件)

[雑誌論文] Acoustic Model Adaptation for Speech Recognition2010
- 著者名/発表者名
  篠田浩一
- 雑誌名
  
  IEICE Transactions on Tnformation and Systems Vol.E93-D, No.9
  
  ページ: 2348-2362
- 査読あり
[雑誌論文] 大規模映像資源のためのマルチモーダル高次特徴検出2010
- 著者名/発表者名
  井上中順、斉藤辰彦、篠田浩一、古井貞煕
- 雑誌名
  
  電子情報通信学会論文誌 Vol.J93-D, No.12
  
  ページ: 2633-2644
- 査読あり
[雑誌論文] Semi-synchronous speech and pen input for mobile user interfaces2010
- 著者名/発表者名
  Koichi Shinoda, Yasushi Watanabe, Kenji Iwata, Yuan Liang, Ryuta Nakagawa, Sadaoki Furui
- 雑誌名
  
  Speech communication Vol.53
  
  ページ: 283-291
- 査読あり
[雑誌論文] Automatic recognition of Indonesian declarative questions and statements using polynomial coefficients of the pitch contours2009
- 著者名/発表者名
  Nazrul Effendy, Koichi Shinoda, Sadaoki Furui, Somchai Jitapunkul
- 雑誌名
  
  2009 The Acoustical Society of Japan、Accoust.Sci.& Tech. No.30
  
  ページ: 249-256
- 査読あり
[学会発表] 音響モデル学習のための相対エントロピーを用いた学習文選択手法2011
- 著者名/発表者名
  村上博子、篠田浩一、古井貞煕
- 学会等名
  日本音響学会2011年春季講演発表会
- 発表場所
  東京
- 年月日
  2011-03-09
[学会発表] Voting Approach in SMAP Adaptation for Speaker Verification2011
- 著者名/発表者名
  Sangeeta Biswas, Marc Ferras, Koichi Shinoda、Sadaoki Furui
- 学会等名
  日本音響学会2011年春季研究発表会
- 発表場所
  東京
- 年月日
  2011-03-09
[学会発表] 雑音下音声におけるスペクトル縮小の分析とその対雑音音声認識への利用2011
- 著者名/発表者名
  別府真由美、篠田浩一、古井貞煕
- 学会等名
  電子情報通信学会SP研究会
- 発表場所
  東京
- 年月日
  2011-03-04
[学会発表] マルチモーダル・マルチフレームな手法を用いたTTECVIDセマンティックインデクシング2011
- 著者名/発表者名
  井上中順、上嶋勇祐、篠田浩一
- 学会等名
  電子情報通信学会PRMU研究会
- 発表場所
  さいたま市
- 年月日
  2011-02-17
[学会発表] 音響モデル学習のための相対エントロピーを用いた学習文選択2011
- 著者名/発表者名
  村上博子、篠田浩一、古井貞煕
- 学会等名
  情報処理学会音声言語情報処理学会
- 発表場所
  福山市
- 年月日
  2011-02-04
[学会発表] Inter-speaker weighted MAP adaptation for GNM-supervector speaker recognition2010
- 著者名/発表者名
  Marc Ferras、Koichi Shinoda、Sadaoki Furui
- 学会等名
  情報処理学会音声言語情報処理学会
- 発表場所
  東京
- 年月日
  2010-12-20
[学会発表] Optimal use of trees in structural MAP adaptation for speaker verification2010
- 著者名/発表者名
  Sangeeta Biswas、Marc Ferras、Koichi Shinoda、Sadaoki Furui
- 学会等名
  報処理学会音声言語情報処理学会
- 発表場所
  東京
- 年月日
  2010-12-20
[学会発表]2010
- 著者名/発表者名
  Nakamasa Inoue, Toshiya Wada、Yusuke Kamishima、Koichi Shinoda、Ilseo Kim、Byungki Byun, Chin-Hui Lee
- 学会等名
  TT+GT at TRECVID 2010 Workshop, TRECVTD 2010 workshop
- 発表場所
  Gaithersburg
- 年月日
  2010-11-15
[学会発表] Gait-based Person Identification Robust against Speed Variation using CHLAC features and HMMs2010
- 著者名/発表者名
  Muhammad Rasyid Aqmar、Koichi Shinoda、Sadaoki Furui
- 学会等名
  電子情報通信学会PRUM研究会
- 発表場所
  千葉市
- 年月日
  2010-10-08
[学会発表] 会議音声認識のためのスペクトル減算に基づく音源分離2010
- 著者名/発表者名
  那須悠、篠田浩一、古井貞煕
- 学会等名
  日本音響学会2010年秋季研究発表会
- 発表場所
  大阪
- 年月日
  2010-09-14
[学会発表] SIFT混合ガウス分布を用いた一般物体認識のためのマルチカーネル学習2010
- 著者名/発表者名
  井上中順、上嶋勇祐、篠田浩一、古井貞煕
- 学会等名
  電子情報通信学会PRMU研究会
- 発表場所
  福岡市
- 年月日
  2010-09-05
[学会発表] Robust Gait Recognition against Speed Variation2010
- 著者名/発表者名
  Muhammad Rasyid Agmar, Koichi Shinoda, Sadaoki Furui
- 学会等名
  ICPR2010
- 発表場所
  Istanbul
- 年月日
  2010-08-23
[学会発表] High-Level Feature Extraction Using SIFT GMMs and Audio Models2010
- 著者名/発表者名
  井上中順, 斉藤辰彦、篠田浩一, 古井貞煕
- 学会等名
  ICPR2010
- 発表場所
  Istanbul
- 年月日
  2010-08-23
[学会発表] ToFカメラによる3D手話認識2010
- 著者名/発表者名
  佐藤新、篠田浩一、古井貞煕
- 学会等名
  画像の認識・理解シンポジウム
- 発表場所
  釧路
- 年月日
  2010-07-27
[学会発表] NTST SRE 2010 : Tokyo Tech Speaker Recognition2010
- 著者名/発表者名
  Marc Ferras、Sangeeta Biswas、Koichi Shinoda、Sadaoki Furui
- 学会等名
  NTST 2010 Speaker recognition evaluation workshop
- 発表場所
  Brno
- 年月日
  2010-06-24
[学会発表] 会議音声認識のためのスペクトル減算に基づくオンライン音源分離2010
- 著者名/発表者名
  那須悠、篠田浩一、古井貞煕
- 学会等名
  電子情報通信学会SP研究会
- 発表場所
  神戸市
- 年月日
  2010-05-26
[学会発表] Speech Modeling Based on Committee-Based Active Learning2010
- 著者名/発表者名
  濱中悠三、篠田浩一、古井貞煕、江森正、越仲孝文
- 学会等名
  ICASSP2010
- 発表場所
  Dallas, U.S.A
- 年月日
  2010-03-14
[学会発表] 音響特徴を用いた映像からのイベント検出の研究2010
- 著者名/発表者名
  斉藤辰彦、井上中順、篠田浩一、古井貞煕
- 学会等名
  日本音響学会2010年春季研究発表会
- 発表場所
  東京
- 年月日
  2010-03-08
[学会発表] 音声認識のための複数の認識器を利用した能動学習2009
- 著者名/発表者名
  濱中悠三、江森正、越中孝文、篠田浩一、古井貞煕
- 学会等名
  情報処理学会音声言語情報処理学会
- 発表場所
  東京
- 年月日
  2009-12-21
[学会発表] SIFT混合ガウス分布と音響特徴を用いた映像からの高次特徴検出2009
- 著者名/発表者名
  井上中順、斉藤辰彦、篠田浩一、古井貞煕
- 学会等名
  電子情報通信学会PRMU研究会
- 発表場所
  金沢市
- 年月日
  2009-11-26
[学会発表] Chin-Hui LeeiTITGT at TRECVID 2009 Workshop2009
- 著者名/発表者名
  Nakamasa Inoue、Shanshan Han、Tatsuhiko Saito、Koichi Shinoda、Ilseo Kim
- 学会等名
  TRECVID Workshop (TRECVID 2009)
- 発表場所
  Gai thersburg
- 年月日
  2009-11-16
[学会発表] Noise robust speech recognition using spectral subtraction and FO information extracted by Hough transform2009
- 著者名/発表者名
  安井英己、篠田浩一、古井貞煕、岩野公司
- 学会等名
  Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference
- 発表場所
  Sapporo、Japan
- 年月日
  2009-10-05
[学会発表] 音声認識のためのコミッティを用いた能動学習2009
- 著者名/発表者名
  濱中悠三、江森正、越仲孝文、篠田浩一、古井貞煕
- 学会等名
  日本音響学会秋季研究発表会
- 発表場所
  郡山市
- 年月日
  2009-09-15
[学会発表] Speaker Adaptation Based on Two-Step Active Learning2009
- 著者名/発表者名
  村上博子、篠田浩一、古井貞煕
- 学会等名
  INTERSPEECH 2009 BRIGHTON
- 発表場所
  Brighton UK
- 年月日
  2009-09-06
[学会発表] ハブ変換による基本周波数情報を用いた耐雑音音声認識の高性能化の検討2009
- 著者名/発表者名
  安井英己、篠田浩一、古井貞煕、岩野公司
- 学会等名
  日本音響学会2009年春季研究発表会
- 発表場所
  東京
- 年月日
  2009-03-17
[学会発表] 能動的な適応文選択に基づく話者適応化2009
- 著者名/発表者名
  村上博子、篠田浩一、古井貞煕
- 学会等名
  日本音響学会2009年春季研究発表会
- 発表場所
  東京
- 年月日
  2009-03-17
[学会発表] 統計的モデル選択によるシーン数の自動推定を用いた動画要約2009
- 著者名/発表者名
  山崎航史、篠田浩一、古井貞煕
- 学会等名
  電子情報通信学会技術研究報告
- 発表場所
  東京
- 年月日
  2009-02-19
[学会発表] Gait Recognition Using CHLAC Features and Hidden Markov Models2009
- 著者名/発表者名
  M.-R.Aqmar、K.Shinoda, S.Furui
- 学会等名
  電子情報通信学会技術研究報告
- 発表場所
  東京
- 年月日
  2009-02-19
[学会発表] 耐雑音音声認識のためハブ変換による基本周波数情報抽出の高速化2009
- 著者名/発表者名
  安井英己、篠田浩一、古井貞煕、岩野公司
- 学会等名
  電子情報通信学会技術研究報告
- 発表場所
  奈良
- 年月日
  2009-01-12
[学会発表] Tokyo Tech at TRBCVID 20082008
- 著者名/発表者名
  S.Hao, Y.Yoshizawa, K.Yamasaki, K.Shinoda, S.Furui
- 学会等名
  TRECVID 2008 workshop
- 発表場所
  Washington D.C., USA
- 年月日
  2008-11-17
[学会発表] Automatically Estimating Number of Scenes for Rushes Summarization2008
- 著者名/発表者名
  山崎航史、篠田浩一, 古井貞煕
- 学会等名
  In Proceedings of the TRECVID BBC Rushes Summarization Workshop (TVS 2008)
- 発表場所
  ACM Multimedia, New York, USA
- 年月日
  2008-10-31
[学会発表] Time-lag Adaptation for Semi-synchronous Speech and Pen Input2008
- 著者名/発表者名
  Yasushi Watanabe、Koichi Shinoda, Sadaoki Furui
- 学会等名
  INTERSPEECH 2008
- 発表場所
  Brisbane、Australia
- 年月日
  2008-09-22
[学会発表] スペクトルサブトラクションとハブ変換による基本周波数情報を用いた耐雑音音声認識2008
- 著者名/発表者名
  安井英己、岩野公司、篠田浩一、古井貞煕
- 学会等名
  日本音響学会
- 発表場所
  九州
- 年月日
  2008-09-10
[備考] ホームページ等
- URL
  http://www.ks.cs.titech.ac.jp

2010 年度 研究成果報告書

ヒューマンコミュニケーション検索・要約のためのマルチモーダル認識の研究

研究代表者

篠田 浩一 東京工業大学, 大学院・情報理工学研究科, 准教授 (10343097)

研究成果

[雑誌論文] Acoustic Model Adaptation for Speech Recognition2010

著者名/発表者名

雑誌名

[雑誌論文] 大規模映像資源のためのマルチモーダル高次特徴検出2010

著者名/発表者名

雑誌名

[雑誌論文] Semi-synchronous speech and pen input for mobile user interfaces2010

著者名/発表者名

雑誌名

[雑誌論文] Automatic recognition of Indonesian declarative questions and statements using polynomial coefficients of the pitch contours2009

著者名/発表者名

雑誌名

[学会発表] 音響モデル学習のための相対エントロピーを用いた学習文選択手法2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Voting Approach in SMAP Adaptation for Speaker Verification2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 雑音下音声におけるスペクトル縮小の分析とその対雑音音声認識への利用2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] マルチモーダル・マルチフレームな手法を用いたTTECVIDセマンティックインデクシング2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音響モデル学習のための相対エントロピーを用いた学習文選択2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Inter-speaker weighted MAP adaptation for GNM-supervector speaker recognition2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Optimal use of trees in structural MAP adaptation for speaker verification2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表]2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Gait-based Person Identification Robust against Speed Variation using CHLAC features and HMMs2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 会議音声認識のためのスペクトル減算に基づく音源分離2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] SIFT混合ガウス分布を用いた一般物体認識のためのマルチカーネル学習2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Robust Gait Recognition against Speed Variation2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] High-Level Feature Extraction Using SIFT GMMs and Audio Models2010

著者名/発表者名

学会等名

2010 年度研究成果報告書

篠田浩一東京工業大学, 大学院・情報理工学研究科, 准教授 (10343097)