2013 Fiscal Year Annual Research Report

音声中の任意語彙検出の高度化と音声認識・音声ドキュメント内容検索への応用

Research Project

Project/Area Number	23700111
Research Institution	University of Yamanashi
Principal Investigator	西崎博光山梨大学, 医学工学総合研究部, 助教 (40362082)
Keywords	音声中の検索語検出 / 音声ドキュメント検索 / 音声ドキュメント処理 / 音声認識 / 音声インタフェース
Research Abstract	本研究の目的は，大規模音声データから任意の語彙が発話されている区間を特定する音声中の任意語彙検出（Spoken Term Detection，STD）技術の高度化を図ること，その技術を大規模音声ドキュメント内容検索（Spoken Document Retrieval，SDR）や音声認識に応用しこれらの精度を改善させることである．平成23年度は，STD技術の高度化に重点を置いて研究を行った．その成果を受けて，平成24年度では，さらなるSTD技術の高度化，並びにSTD技術の音声認識への応用に取り組んだ．平成25年度は，STDの高精度化に加えて，この技術を用いた音声ドキュメント処理，未知語検出などへの応用を図った．これまでに開発したSTD技術では，複数の音声認識器を用いた音声認識結果を利用し，高い検索語の検出性能を得ることに成功した．今回，STD技術の実利用を狙うため，高い検出率と湧き出し誤りの両方を実現する方法を考案した．通常，高い検出率と湧き出し誤りの増加には高い相関がある．STD技術を実利用するためには，高い検出率が必要であり，この場合湧き出し誤りの増加は避けて通れない．そこで，検索用インデックスの複雑さ尺度（エントロピー）を用いて湧き出し誤りを抑制する手法を考案した．これにより，高い検出率が得られたときでも，湧き出し誤りを抑制することに成功した（学会講演音声のSTDタスクにおいて，F値を用いた検索性能で0.457が0.568に改善）．さらに，開発したSTD技術を用いて音声認識において大変重要な未知語を自動獲得する手法を開発した．またSTDを用いた言語モデルの話題適応化手法を提案し，音声認識率の精度が改善することも確かめた．最後に，電子ノートシステムに音声・動画を検索する機能としてSTD技術を組み込んだ．被験者実験の結果，本STD技術が実利用できる可能性が高いことを示せた．

Research Products
(17 results)

All 2013 Other

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (12 results) Remarks (1 results)

[Journal Article] Spoken Term Detection Using Phoneme Transition Network from Multiple Speech Recognizers' Outputs2013
- Author(s)
  Satoshi Natori, Yuto Furuya, Hiromitsu Nishizaki, Yoshihiro Sekiguchi
- Journal Title
  
  Journal of Information Processing
  
  Volume: 21 Pages: 176-185
- DOI
  10.2197/ipsjjip.21.176
- Peer Reviewed
[Journal Article] 聞き耳メモリー：音声認識結果を取捨選択して利用する電子メモ作成支援アプリケーション2013
- Author(s)
  西崎博光，太田晃平，関口芳廣
- Journal Title
  
  電子情報通信学会論文誌
  
  Volume: J96-D Pages: 2379-2389
- Peer Reviewed
[Journal Article] Entropy-based False Detection Filtering in Spoken Term Detection Tasks2013
- Author(s)
  Satoshi Natori, Yuto Furuya, Hiromitsu Nishizak, Yoshihiro Sekiguchi
- Journal Title
  
  Proceedings of the 5th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2013)
  
  Volume: 1 Pages: 1-7
- Peer Reviewed
[Journal Article] Evaluation of the Usefulness of Spoken Term Detection in an Electronic Note-Taking Support System2013
- Author(s)
  Chifuyu Yonekura, Yuto Furuya, Satoshi Natori, Hiromitsu Nishizak, Yoshihiro Sekiguchi
- Journal Title
  
  Proceedings of the 5th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2013)
  
  Volume: 1 Pages: 1-4
- Peer Reviewed
[Presentation] キーワード集合をクエリとする最良照合STD方式
- Author(s)
  堂元健太郎，宇津呂武仁，古屋裕斗，西崎博光
- Organizer
  第8回音声ドキュメント処理ワークショップ講演論文集
- Place of Presentation
  愛知県豊橋市（豊橋市民センター）
[Presentation] 音声ドキュメントからの頻出発話語句の発見”，第8回音声ドキュメント処理ワークショップ講演論文集
- Author(s)
  米倉千冬，古屋裕斗，澤田直輝，名取賢，西崎博光，関口芳廣
- Organizer
  第8回音声ドキュメント処理ワークショップ講演論文集
- Place of Presentation
  愛知県豊橋市（豊橋市民センター）
[Presentation] STD システムへの音素間距離の導入方法の検討
- Author(s)
  澤田直輝，古屋裕斗，名取賢，西崎博光，関口芳廣
- Organizer
  日本音響学会2014年春季研究発表会
- Place of Presentation
  東京都千代田区（日本大学駿河台キャンパス）
[Presentation] キーワード集合をクエリとする最良照合 STD による音声ドキュメント索引付け
- Author(s)
  堂元健太郎，宇津呂武仁，古屋裕斗，西崎博光
- Organizer
  日本音響学会2014年春季研究発表会
- Place of Presentation
  東京都千代田区（日本大学駿河台キャンパス）
[Presentation] クエリのエントロピーを利用した STD 手法の検討
- Author(s)
  古屋裕斗，名取賢，西崎博光，関口芳廣
- Organizer
  日本音響学会2014年春季研究発表会
- Place of Presentation
  東京都千代田区（日本大学駿河台キャンパス）
[Presentation] NTCIR-10 SpokenDoc-2 Spoken Term Detectionタスクの結果と知見
- Author(s)
  西崎博光，秋葉友良，相川清明，伊藤慶明，河原達也，胡新輝，中川聖一，南條浩輝，山下洋一
- Organizer
  日本音響学会2013年秋季研究発表会
- Place of Presentation
  愛知県豊橋市（豊橋技術科学大学）
[Presentation] NTCIR-10 SpokenDoc-2 Spoken Content Retrievalタスクの結果と知見
- Author(s)
  秋葉友良，西崎博光，相川清明，伊藤慶明，河原達也，胡新輝，中川聖一，南條浩輝，山下洋一
- Organizer
  日本音響学会2013年秋季研究発表会
- Place of Presentation
  愛知県豊橋市（豊橋技術科学大学）
[Presentation] 条件付き確率場を用いた音声中の検索語検出の検討
- Author(s)
  西崎博光，古屋裕斗，名取賢，関口芳廣
- Organizer
  日本音響学会2013年秋季研究発表会
- Place of Presentation
  愛知県豊橋市（豊橋技術科学大学）
[Presentation] Web文書及びSTDを利用した言語モデル・認識辞書の話題適応化
- Author(s)
  鈴木和将，西崎博光，関口芳廣
- Organizer
  日本音響学会2013年秋季研究発表会
- Place of Presentation
  愛知県豊橋市（豊橋技術科学大学）
[Presentation] Overview of the NTCIR-10 SpokenDoc-2 Task
- Author(s)
  Tomoyosi Akiba, Hiromitsu Nishizaki, Kiyoaki Aikawa, Xinhui Hu, Yoshiaki Itoh, Tatsuya Kawahara, Seiichi Nakagawa, Hiroaki Nanjo, Yoichi Yamashita
- Organizer
  The 10th NTCIR Conference
- Place of Presentation
  東京都千代田区（学術総合センター）
[Presentation] STD and SCR Techniques and Their Evaluations on the NTCIR-10 SpokenDoc-2 Task
- Author(s)
  Yuto Furuya, Daiki Nakagomi, Satoshi Natori, Hiromitsu Nishizaki, Yoshihiro Sekiguchi
- Organizer
  The 10th NTCIR Conference
- Place of Presentation
  東京都千代田区（学術総合センター）
[Presentation] 電子ノート作成支援システムで利用する音声からのキーワード検出技術
- Author(s)
  米倉千冬，古屋裕斗，太田晃平，西崎博光，関口芳廣
- Organizer
  電子情報通信学会　言語理解とコミュニケーション研究会
- Place of Presentation
  茨城県つくば市（筑波大学）
[Remarks] 山梨大学西崎研究室
- URL
  http://www.alps-lab.org/

2013 Fiscal Year Annual Research Report

音声中の任意語彙検出の高度化と音声認識・音声ドキュメント内容検索への応用

Principal Investigator

西崎 博光 山梨大学, 医学工学総合研究部, 助教 (40362082)

Research Products

[Journal Article] Spoken Term Detection Using Phoneme Transition Network from Multiple Speech Recognizers' Outputs2013

Author(s)

Journal Title

DOI

[Journal Article] 聞き耳メモリー：音声認識結果を取捨選択して利用する電子メモ作成支援アプリケーション2013

Author(s)

Journal Title

[Journal Article] Entropy-based False Detection Filtering in Spoken Term Detection Tasks2013

Author(s)

Journal Title

[Journal Article] Evaluation of the Usefulness of Spoken Term Detection in an Electronic Note-Taking Support System2013

Author(s)

Journal Title

[Presentation] キーワード集合をクエリとする最良照合STD方式

Author(s)

Organizer

Place of Presentation

[Presentation] 音声ドキュメントからの頻出発話語句の発見”，第8回音声ドキュメント処理ワークショップ講演論文集

Author(s)

Organizer

Place of Presentation

[Presentation] STD システムへの音素間距離の導入方法の検討

Author(s)

Organizer

Place of Presentation

[Presentation] キーワード集合をクエリとする最良照合 STD による音声ドキュメント索引付け

Author(s)

Organizer

Place of Presentation

[Presentation] クエリのエントロピーを利用した STD 手法の検討

Author(s)

Organizer

Place of Presentation

[Presentation] NTCIR-10 SpokenDoc-2 Spoken Term Detectionタスクの結果と知見

Author(s)

Organizer

Place of Presentation

[Presentation] NTCIR-10 SpokenDoc-2 Spoken Content Retrievalタスクの結果と知見

Author(s)

Organizer

Place of Presentation

[Presentation] 条件付き確率場を用いた音声中の検索語検出の検討

Author(s)

Organizer

Place of Presentation

[Presentation] Web文書及びSTDを利用した言語モデル・認識辞書の話題適応化

Author(s)

Organizer

Place of Presentation

[Presentation] Overview of the NTCIR-10 SpokenDoc-2 Task

Author(s)

Organizer

Place of Presentation

[Presentation] STD and SCR Techniques and Their Evaluations on the NTCIR-10 SpokenDoc-2 Task

Author(s)

Organizer

Place of Presentation

[Presentation] 電子ノート作成支援システムで利用する音声からのキーワード検出技術

Author(s)

Organizer

Place of Presentation

[Remarks] 山梨大学 西崎研究室

URL

西崎博光山梨大学, 医学工学総合研究部, 助教 (40362082)

[Remarks] 山梨大学西崎研究室