2013 年度実績報告書

音声中の任意語彙検出の高度化と音声認識・音声ドキュメント内容検索への応用

研究課題

研究課題/領域番号	23700111
研究機関	山梨大学
研究代表者	西崎博光山梨大学, 医学工学総合研究部, 助教 (40362082)
キーワード	音声中の検索語検出 / 音声ドキュメント検索 / 音声ドキュメント処理 / 音声認識 / 音声インタフェース
研究概要	本研究の目的は，大規模音声データから任意の語彙が発話されている区間を特定する音声中の任意語彙検出（Spoken Term Detection，STD）技術の高度化を図ること，その技術を大規模音声ドキュメント内容検索（Spoken Document Retrieval，SDR）や音声認識に応用しこれらの精度を改善させることである．平成23年度は，STD技術の高度化に重点を置いて研究を行った．その成果を受けて，平成24年度では，さらなるSTD技術の高度化，並びにSTD技術の音声認識への応用に取り組んだ．平成25年度は，STDの高精度化に加えて，この技術を用いた音声ドキュメント処理，未知語検出などへの応用を図った．これまでに開発したSTD技術では，複数の音声認識器を用いた音声認識結果を利用し，高い検索語の検出性能を得ることに成功した．今回，STD技術の実利用を狙うため，高い検出率と湧き出し誤りの両方を実現する方法を考案した．通常，高い検出率と湧き出し誤りの増加には高い相関がある．STD技術を実利用するためには，高い検出率が必要であり，この場合湧き出し誤りの増加は避けて通れない．そこで，検索用インデックスの複雑さ尺度（エントロピー）を用いて湧き出し誤りを抑制する手法を考案した．これにより，高い検出率が得られたときでも，湧き出し誤りを抑制することに成功した（学会講演音声のSTDタスクにおいて，F値を用いた検索性能で0.457が0.568に改善）．さらに，開発したSTD技術を用いて音声認識において大変重要な未知語を自動獲得する手法を開発した．またSTDを用いた言語モデルの話題適応化手法を提案し，音声認識率の精度が改善することも確かめた．最後に，電子ノートシステムに音声・動画を検索する機能としてSTD技術を組み込んだ．被験者実験の結果，本STD技術が実利用できる可能性が高いことを示せた．

研究成果
(17件)

すべて 2013 その他

すべて雑誌論文 (4件) (うち査読あり 4件) 学会発表 (12件) 備考 (1件)

[雑誌論文] Spoken Term Detection Using Phoneme Transition Network from Multiple Speech Recognizers' Outputs2013
- 著者名/発表者名
  Satoshi Natori, Yuto Furuya, Hiromitsu Nishizaki, Yoshihiro Sekiguchi
- 雑誌名
  
  Journal of Information Processing
  
  巻: 21 ページ: 176-185
- DOI
  10.2197/ipsjjip.21.176
- 査読あり
[雑誌論文] 聞き耳メモリー：音声認識結果を取捨選択して利用する電子メモ作成支援アプリケーション2013
- 著者名/発表者名
  西崎博光，太田晃平，関口芳廣
- 雑誌名
  
  電子情報通信学会論文誌
  
  巻: J96-D ページ: 2379-2389
- 査読あり
[雑誌論文] Entropy-based False Detection Filtering in Spoken Term Detection Tasks2013
- 著者名/発表者名
  Satoshi Natori, Yuto Furuya, Hiromitsu Nishizak, Yoshihiro Sekiguchi
- 雑誌名
  
  Proceedings of the 5th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2013)
  
  巻: 1 ページ: 1-7
- 査読あり
[雑誌論文] Evaluation of the Usefulness of Spoken Term Detection in an Electronic Note-Taking Support System2013
- 著者名/発表者名
  Chifuyu Yonekura, Yuto Furuya, Satoshi Natori, Hiromitsu Nishizak, Yoshihiro Sekiguchi
- 雑誌名
  
  Proceedings of the 5th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2013)
  
  巻: 1 ページ: 1-4
- 査読あり
[学会発表] キーワード集合をクエリとする最良照合STD方式
- 著者名/発表者名
  堂元健太郎，宇津呂武仁，古屋裕斗，西崎博光
- 学会等名
  第8回音声ドキュメント処理ワークショップ講演論文集
- 発表場所
  愛知県豊橋市（豊橋市民センター）
[学会発表] 音声ドキュメントからの頻出発話語句の発見”，第8回音声ドキュメント処理ワークショップ講演論文集
- 著者名/発表者名
  米倉千冬，古屋裕斗，澤田直輝，名取賢，西崎博光，関口芳廣
- 学会等名
  第8回音声ドキュメント処理ワークショップ講演論文集
- 発表場所
  愛知県豊橋市（豊橋市民センター）
[学会発表] STD システムへの音素間距離の導入方法の検討
- 著者名/発表者名
  澤田直輝，古屋裕斗，名取賢，西崎博光，関口芳廣
- 学会等名
  日本音響学会2014年春季研究発表会
- 発表場所
  東京都千代田区（日本大学駿河台キャンパス）
[学会発表] キーワード集合をクエリとする最良照合 STD による音声ドキュメント索引付け
- 著者名/発表者名
  堂元健太郎，宇津呂武仁，古屋裕斗，西崎博光
- 学会等名
  日本音響学会2014年春季研究発表会
- 発表場所
  東京都千代田区（日本大学駿河台キャンパス）
[学会発表] クエリのエントロピーを利用した STD 手法の検討
- 著者名/発表者名
  古屋裕斗，名取賢，西崎博光，関口芳廣
- 学会等名
  日本音響学会2014年春季研究発表会
- 発表場所
  東京都千代田区（日本大学駿河台キャンパス）
[学会発表] NTCIR-10 SpokenDoc-2 Spoken Term Detectionタスクの結果と知見
- 著者名/発表者名
  西崎博光，秋葉友良，相川清明，伊藤慶明，河原達也，胡新輝，中川聖一，南條浩輝，山下洋一
- 学会等名
  日本音響学会2013年秋季研究発表会
- 発表場所
  愛知県豊橋市（豊橋技術科学大学）
[学会発表] NTCIR-10 SpokenDoc-2 Spoken Content Retrievalタスクの結果と知見
- 著者名/発表者名
  秋葉友良，西崎博光，相川清明，伊藤慶明，河原達也，胡新輝，中川聖一，南條浩輝，山下洋一
- 学会等名
  日本音響学会2013年秋季研究発表会
- 発表場所
  愛知県豊橋市（豊橋技術科学大学）
[学会発表] 条件付き確率場を用いた音声中の検索語検出の検討
- 著者名/発表者名
  西崎博光，古屋裕斗，名取賢，関口芳廣
- 学会等名
  日本音響学会2013年秋季研究発表会
- 発表場所
  愛知県豊橋市（豊橋技術科学大学）
[学会発表] Web文書及びSTDを利用した言語モデル・認識辞書の話題適応化
- 著者名/発表者名
  鈴木和将，西崎博光，関口芳廣
- 学会等名
  日本音響学会2013年秋季研究発表会
- 発表場所
  愛知県豊橋市（豊橋技術科学大学）
[学会発表] Overview of the NTCIR-10 SpokenDoc-2 Task
- 著者名/発表者名
  Tomoyosi Akiba, Hiromitsu Nishizaki, Kiyoaki Aikawa, Xinhui Hu, Yoshiaki Itoh, Tatsuya Kawahara, Seiichi Nakagawa, Hiroaki Nanjo, Yoichi Yamashita
- 学会等名
  The 10th NTCIR Conference
- 発表場所
  東京都千代田区（学術総合センター）
[学会発表] STD and SCR Techniques and Their Evaluations on the NTCIR-10 SpokenDoc-2 Task
- 著者名/発表者名
  Yuto Furuya, Daiki Nakagomi, Satoshi Natori, Hiromitsu Nishizaki, Yoshihiro Sekiguchi
- 学会等名
  The 10th NTCIR Conference
- 発表場所
  東京都千代田区（学術総合センター）
[学会発表] 電子ノート作成支援システムで利用する音声からのキーワード検出技術
- 著者名/発表者名
  米倉千冬，古屋裕斗，太田晃平，西崎博光，関口芳廣
- 学会等名
  電子情報通信学会　言語理解とコミュニケーション研究会
- 発表場所
  茨城県つくば市（筑波大学）
[備考] 山梨大学西崎研究室
- URL
  http://www.alps-lab.org/

2013 年度 実績報告書

音声中の任意語彙検出の高度化と音声認識・音声ドキュメント内容検索への応用

研究代表者

西崎 博光 山梨大学, 医学工学総合研究部, 助教 (40362082)

研究成果

[雑誌論文] Spoken Term Detection Using Phoneme Transition Network from Multiple Speech Recognizers' Outputs2013

著者名/発表者名

雑誌名

DOI

[雑誌論文] 聞き耳メモリー：音声認識結果を取捨選択して利用する電子メモ作成支援アプリケーション2013

著者名/発表者名

雑誌名

[雑誌論文] Entropy-based False Detection Filtering in Spoken Term Detection Tasks2013

著者名/発表者名

雑誌名

[雑誌論文] Evaluation of the Usefulness of Spoken Term Detection in an Electronic Note-Taking Support System2013

著者名/発表者名

雑誌名

[学会発表] キーワード集合をクエリとする最良照合STD方式

著者名/発表者名

学会等名

発表場所

[学会発表] 音声ドキュメントからの頻出発話語句の発見”，第8回音声ドキュメント処理ワークショップ講演論文集

著者名/発表者名

学会等名

発表場所

[学会発表] STD システムへの音素間距離の導入方法の検討

著者名/発表者名

学会等名

発表場所

[学会発表] キーワード集合をクエリとする最良照合 STD による音声ドキュメント索引付け

著者名/発表者名

学会等名

発表場所

[学会発表] クエリのエントロピーを利用した STD 手法の検討

著者名/発表者名

学会等名

発表場所

[学会発表] NTCIR-10 SpokenDoc-2 Spoken Term Detectionタスクの結果と知見

著者名/発表者名

学会等名

発表場所

[学会発表] NTCIR-10 SpokenDoc-2 Spoken Content Retrievalタスクの結果と知見

著者名/発表者名

学会等名

発表場所

[学会発表] 条件付き確率場を用いた音声中の検索語検出の検討

著者名/発表者名

学会等名

発表場所

[学会発表] Web文書及びSTDを利用した言語モデル・認識辞書の話題適応化

著者名/発表者名

学会等名

発表場所

[学会発表] Overview of the NTCIR-10 SpokenDoc-2 Task

著者名/発表者名

学会等名

発表場所

[学会発表] STD and SCR Techniques and Their Evaluations on the NTCIR-10 SpokenDoc-2 Task

著者名/発表者名

学会等名

発表場所

[学会発表] 電子ノート作成支援システムで利用する音声からのキーワード検出技術

著者名/発表者名

学会等名

発表場所

[備考] 山梨大学 西崎研究室

URL

2013 年度実績報告書

西崎博光山梨大学, 医学工学総合研究部, 助教 (40362082)

[備考] 山梨大学西崎研究室