2010 年度研究成果報告書

語彙の確率的構造に基づく符号化による多選択肢タスク用音声認識の高精度化

研究課題

研究課題/領域番号	20500166
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	知覚情報処理・知能ロボティクス
研究機関	法政大学
研究代表者	伊藤克亘法政大学, 情報科学部, 教授 (30356472)
研究期間 (年度)	2008 – 2010
キーワード	音声認識 / 話者認識 / 音響ライフログ
研究概要	音声認識において、言語モデルの貢献を度外視した場合には、音素単位では認識率が悪くなる可能性は観測されたが、特定の音素系列において統計的に有意なレベルで認識率が悪化することはないことがわかった。一方で、話者認識・話者識別においては、言語モデルを利用しないのが一般的であるため、単語認識と同様の問題が生じることがわかった。さらに、話者識別のほとんどの応用では、学習データを十分に得ることが期待できない。さらに認識対象の音素系列を事前に想定できないことも多く、音声認識より高性能化が難しい問題であることが明らかになった。

研究成果
(15件)

すべて 2011 2010 2009 2008 その他

すべて学会発表 (14件) 備考 (1件)

[学会発表] 話者照合と音声認識を併用したスマートフォン向け認証システムの作成2011
- 著者名/発表者名
  平野邦彦,伊藤克亘
- 学会等名
  情報処理学会全国大会(査読無)
- 年月日
  2011-03-04
[学会発表] デジタル放送の字幕情報を用いた発話者のアノテーション2011
- 著者名/発表者名
  山室慶太,伊藤克亘
- 学会等名
  情報処理学会全国大会(査読無)
- 年月日
  2011-03-04
[学会発表] 音声を用いた農作業日誌システムの構築2011
- 著者名/発表者名
  住澤卓也,伊藤克亘
- 学会等名
  情報処理学会全国大会(査読無)
- 年月日
  2011-03-04
[学会発表] Speaker model updating by the conversational sounds in speaker verification2010
- 著者名/発表者名
  Keita Yamamuro, Katunobu ITOU
- 学会等名
  IIWAS2010(査読有)
- 年月日
  2010-11-04
[学会発表] Speaker model updating by the conversational sounds in speaker verification2010
- 著者名/発表者名
  Kazufumi Nakamura, Katunobu ITOU
- 学会等名
  internoise 2010(概要査読有)
- 年月日
  2010-06-15
[学会発表] 音響ライフログへのアノテーションのための話者と場所の自動分類2010
- 著者名/発表者名
  山野貴一郎,伊藤克亘
- 学会等名
  情報処理学会全国大会(査読無)
- 年月日
  2010-03-11
[学会発表] 携帯端末への話者照合を用いたセキュリティロック2010
- 著者名/発表者名
  山室慶太,伊藤克亘
- 学会等名
  情報処理学会全国大会(査読無)
- 年月日
  2010-03-11
[学会発表] 高齢者の加齢による聴力低下に対応する音声強調2010
- 著者名/発表者名
  田母神恒,伊藤克亘
- 学会等名
  情報処理学会全国大会(査読無)
- 年月日
  2010-03-11
[学会発表] Flashコンテンツ操作のための音声認識インタフェース2010
- 著者名/発表者名
  松浦健太,伊藤克亘
- 学会等名
  情報処理学会全国大会(査読無)
- 年月日
  2010-03-11
[学会発表] コンテンツ制作における収録音編集のための音声強調2010
- 著者名/発表者名
  中村一文,伊藤克亘
- 学会等名
  情報処理学会全国大会(査読無)
- 年月日
  2010-03-10
[学会発表] Browsing Audio Life-log Data Using Acoustic and Location Information2009
- 著者名/発表者名
  Kiichiro Yamano, Katunobu ITOU
- 学会等名
  UBICOMM 2009(査読有)
- 年月日
  2009-11-15
[学会発表] バイノーラルマイクを用いたライフログ映像のショット識別2008
- 著者名/発表者名
  山野貴一郎,伊藤克亘
- 学会等名
  信号処理シンポジウム(査読無)
- 年月日
  2008-11-13
[学会発表] Detecting Scenes in Lifelog Videos based on Probabilistic Models of Audio data.2008
- 著者名/発表者名
  Kiichiro Yamano, Katunobu ITOU
- 学会等名
  Acoustics, 08(概要査読有)
- 年月日
  2008-07-03
[学会発表] 情報処理学会全国大会(査読無)
- 著者名/発表者名
  山野貴一郎,伊藤克亘,音響情報を用いたライフログデータのインデキシング
- 学会等名
  20090311
[備考] ホームページ等
- URL
  http://cis.k.hosei.ac.jp/info/faculty/digital/itou.html

2010 年度 研究成果報告書

語彙の確率的構造に基づく符号化による多選択肢タスク用音声認識の高精度化

研究代表者

伊藤 克亘 法政大学, 情報科学部, 教授 (30356472)

研究成果

[学会発表] 話者照合と音声認識を併用したスマートフォン向け認証システムの作成2011

著者名/発表者名

学会等名

年月日

[学会発表] デジタル放送の字幕情報を用いた発話者のアノテーション2011

著者名/発表者名

学会等名

年月日

[学会発表] 音声を用いた農作業日誌システムの構築2011

著者名/発表者名

学会等名

年月日

[学会発表] Speaker model updating by the conversational sounds in speaker verification2010

著者名/発表者名

学会等名

年月日

[学会発表] Speaker model updating by the conversational sounds in speaker verification2010

著者名/発表者名

学会等名

年月日

[学会発表] 音響ライフログへのアノテーションのための話者と場所の自動分類2010

著者名/発表者名

学会等名

年月日

[学会発表] 携帯端末への話者照合を用いたセキュリティロック2010

著者名/発表者名

学会等名

年月日

[学会発表] 高齢者の加齢による聴力低下に対応する音声強調2010

著者名/発表者名

学会等名

年月日

[学会発表] Flashコンテンツ操作のための音声認識インタフェース2010

著者名/発表者名

学会等名

年月日

[学会発表] コンテンツ制作における収録音編集のための音声強調2010

著者名/発表者名

学会等名

年月日

[学会発表] Browsing Audio Life-log Data Using Acoustic and Location Information2009

著者名/発表者名

学会等名

年月日

[学会発表] バイノーラルマイクを用いたライフログ映像のショット識別2008

著者名/発表者名

学会等名

年月日

[学会発表] Detecting Scenes in Lifelog Videos based on Probabilistic Models of Audio data.2008

著者名/発表者名

学会等名

年月日

[学会発表] 情報処理学会全国大会(査読無)

著者名/発表者名

学会等名

[備考] ホームページ等

URL

2010 年度研究成果報告書

伊藤克亘法政大学, 情報科学部, 教授 (30356472)