• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実施状況報告書

音声中の任意語彙検出の高度化と音声認識・音声ドキュメント内容検索への応用

研究課題

研究課題/領域番号 23700111
研究機関山梨大学

研究代表者

西崎 博光  山梨大学, 医学工学総合研究部, 助教 (40362082)

キーワード音声中の検索語検出 / 音声ドキュメント処理 / 音声内容検索 / 音声認識 / 音声インタフェース
研究概要

本研究の目的は大規模音声データから任意の語彙が発話されている区間を特定する音声中の任意語彙検出(STD)技術の高度化を図ること,その技術を大規模音声ドキュメント内容検索と音声認識に応用しこれらの精度を改善させることである.平成23年度は,STD技術の高度化に重点を置いて研究を行った.その成果を受け,平成24年度では,さらなるSTD技術の高度化とSTD技術の音声認識への応用に取り組んだ.
平成24年度では,STD技術の実利用を狙うため,高い検出率と湧き出し誤り削減の両方を実現する方法を考案した.通常,高い検出率と湧き出し誤りの増加には高い相関がある.STD技術を実利用するためには,高い検出率が必要であり,この場合,湧き出し誤りの増加は避けて通れない.そこで,検索用インデックスの複雑さ尺度を用いて湧き出し誤りを抑制する手法を考案した.これにより,高い検出率が得られたときでも湧き出し誤りを抑制することに成功した(検出率65~80%で湧き出し誤りを最大10%抑制).この技術を,「電子ノート作成支援システム」に搭載した.このシステムでは大学の講義音声・動画をタブレット端末に保存することができ,音声・動画を検索する機能として,STD技術を組み込んだ.被験者実験の結果,本STD技術が実利用できることを示せた.
さらに,STD技術を音声認識性能の改善に応用する方法を考案した.音声のアーカイブを音声認識で行うことを考えたとき,必ずしもリアルタイムで音声認識を行う必要はない.そこで認識対象の音声に対してSTDを行い,認識対象音声にどのような単語が含まれているのかを推定しておく.推定された単語のみを使って音声認識辞書を作成し,この辞書を用いて再度音声認識することで認識率を改善する.実験の結果,約1.5%の認識率の改善を得ることができた.
以上が平成24年度の研究実績である.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成24年度の目標は,STD技術のさらなる高度化を図ることと,STD技術の音声認識への応用が目標であった.本報告書の「研究実績の概要」でも説明したように,新しい尺度を考案し,平成23年度に開発したSTD技術を更に高めることができた.また,実環境での利用を想定し,電子ノート作成支援システムを開発した.このシステムにSTD技術を組み込むことで,実用化への足がかりを得た.また,STD技術を音声認識性能の改善に応用する方法を提案し,提案手法によって一定の効果を得ることができた.
以上のことから,計画通りにおおむね順調に研究が進んでいると言える.

今後の研究の推進方策

これまでの研究成果により,高い検索性能を持つSTD技術を開発することができた.しかし,検索精度は高いが,検索時間が遅く,実用的に本技術を利用するにはまだ少し問題が残る.そこで,本年度は,開発したSTDの検索精度を損なわない処理の高速化の研究を行う.具体的には,分散処理あるいはインデキシングの改良によって,これを実現する予定である.同時に,STD技術を高めるために,新しいSTD技術を模索する.具体的には,機械学習手法を用いて「音声認識システムの誤り方」のモデルを学習し,このモデルをこれまでに開発してきたSTD技術と融合する.これによって,高速化とさらなる高度化を実現することができる.また,国立情報学研究所が主催する競争型国際会議「NTCIR-10(第10回NTCIRカンファレンス成果報告会)」に参加し,STD技術を評価したい.NTCIR-10ではSTDを対象とした競争型タスクが提案されている.NTCIR-10に参加した全チームは,共通の評価基盤を利用していることから,本技術が世界の技術の中でどこに位置づけられているのかを知ることができる.
また,最終年度では,STD技術の応用を模索する.例えば,音声ドキュメント内容検索へ応用することで,検索の高精度化を目指す.また,音声インタフェースを備えたシステムにSTD技術を組み込み,使い勝手の良いインタフェースの実現を目指すことで,本技術の実用化に弾みをつけたい.

次年度の研究費の使用計画

平成24年度は約37万円の繰越が発生した.これは,予定していた国際会議(アメリカで開催)へ投稿した論文が力及ばず不採択になり,同国際会議に参加をしなかったためである.渡航費および会議参加費を有効利用するため,平成25年度に繰り越すこととした.
平成25年度は,STDの分散処理化を計画しているため,高速計算機を2台購入予定にしている(平成24年度分の繰越しを利用し,より高速な計算機を購入する).また,平成23・24年度の研究成果を国際会議で報告するための旅費・研究成果をまとめた論文の論文掲載料を計上する.

  • 研究成果

    (10件)

すべて 2013 2012

すべて 雑誌論文 (5件) (うち査読あり 5件) 学会発表 (5件)

  • [雑誌論文] 音声中の検索語検出のためのテストコレクションの構築と分析2013

    • 著者名/発表者名
      伊藤慶明,西崎博光,中川聖一,秋葉友良,河原達也,胡新輝,南條浩輝,松井知子,山下洋一,相川清明
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.54, No.2 ページ: 471-483

    • 査読あり
  • [雑誌論文] Evaluation Framework Design of Spoken Term Detection Study at the NTCIR-9 IR for Spoken Documents Task2012

    • 著者名/発表者名
      Hiromitsu Nishizaki, Tomoyosi Akiba, Kiyoaki Aikawa, Tatsuya Kawahara and Tomoko Matsui
    • 雑誌名

      Journal of Natural Language Processing

      巻: Vol.19, No.4 ページ: 329-350

    • URL

      https://www.jstage.jst.go.jp/article/jnlp/19/4/19_329/_pdf/

    • 査読あり
  • [雑誌論文] Designing an Evaluation Framework for Spoken Term Detection and Spoken Document Retrieval at the NTCIR-9 SpokenDoc Task2012

    • 著者名/発表者名
      Tomoyosi Akiba, Hiromitsu Nishizaki, Kiyoaki Aikawa, Tatsuya Kawahara, and Tomoko Matsui
    • 雑誌名

      Proceedings of the eighth international conference on Language Resources and Evaluation

      巻: - ページ: 3527-3534

    • 査読あり
  • [雑誌論文] Development of Note-Taking Support System with Speech Interface2012

    • 著者名/発表者名
      Kohei Ota, Hiromitsu Nishizaki, and Yoshihiro Sekiguchi
    • 雑誌名

      Proceedings of the Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2012)

      巻: - ページ: CD-ROM

    • 査読あり
  • [雑誌論文] Introduction of False Detection Control Parameters in Spoken Term Detection2012

    • 著者名/発表者名
      Yuto Furuya, Satoshi Natori, Hiromitsu Nishizaki, and Yoshihiro Sekiguchi
    • 雑誌名

      Proceedings of the Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2012)

      巻: - ページ: CD-ROM

    • 査読あり
  • [学会発表] 電子ノート作成支援システム上での音声中の検索語検出技術の検証2013

    • 著者名/発表者名
      米倉千冬,太田晃平,西崎博光,関口芳廣
    • 学会等名
      日本音響学会2013年春季研究発表会
    • 発表場所
      東京工科大学(八王子市)
    • 年月日
      20130315-20130315
  • [学会発表] 音声中の検索語検出のための音素遷移ネットワークのエントロピー分析析2013

    • 著者名/発表者名
      古屋裕斗,西崎博光,関口芳廣
    • 学会等名
      第7回音声ドキュメント処理ワークショップ
    • 発表場所
      名古屋大学(名古屋市)
    • 年月日
      20130302-20130302
  • [学会発表] 講義で利用できる音声と画像を融合した電子ノート作成支援システムの開発2012

    • 著者名/発表者名
      太田晃平,西崎博光,関口芳廣
    • 学会等名
      日本教育工学会 研究会
    • 発表場所
      岡山大学(岡山市)
    • 年月日
      20121027-20121027
  • [学会発表] STDのための音素遷移ネットワークのエントロピーによる分析2012

    • 著者名/発表者名
      古屋裕斗,西崎博光,関口芳廣
    • 学会等名
      日本音響学会2012年秋季研究発表会
    • 発表場所
      信州大学(長野市)
    • 年月日
      20120921-20120921
  • [学会発表] クラウド時代の新しい音声研究パラダイム2012

    • 著者名/発表者名
      秋葉友良,岩野公司,緒方淳,小川哲司,小野順貴,篠崎隆宏,篠田浩一,南條浩輝,西崎博光,西田昌史,西村竜一,原 直,堀 貴明
    • 学会等名
      情報処理学会 第92回音声言語情報処理研究会
    • 発表場所
      天童温泉滝の湯(山形県天童市)
    • 年月日
      20120719-20120719

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi