• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実施状況報告書

音響と映像の共通インデックスに基づく音響・映像の高度検索技術・双方向検索システム

研究課題

研究課題/領域番号 24500124
研究種目

基盤研究(C)

研究機関岩手県立大学

研究代表者

伊藤 慶明  岩手県立大学, ソフトウェア情報学部, 教授 (90325928)

研究分担者 大川 茂樹  千葉工業大学, 工学部, 教授 (40306395)
田中 和世  筑波大学, 図書館情報メディア研究科(系), 教授 (70344207)
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード音声ドキュメント処理 / 検索 / 音響情報 / 映像情報
研究概要

近年ビデオを録画する際の機器が大容量化・普及し、今後は一週間の放送全てを録画しておき、見たい/聞きたい部分を検索・抽出して所望の区間のみを鑑賞するというようなライフスタイルに変化し、容易かつ自由なビデオの検索機能が望まれるようになった。そこで、本研究では音声を中心とした音響情報と映像上情報を共通のインデックス化し,相互に情報を利用することによって高度な検索技術、映像と音響の双方向の検索を実現する技術開発を目的としている。本研究は以下の4つ要素技術の研究開発をベースとしている。
(1)音響・音声情報のインデキシング方式の研究開発
(2)映像・音響情報を利用した類似動画検索方式の研究開発
(3)WEB上の情報・知識源を利用した映像情報のインデキシング方式の研究開発
(4)高度・双方向検索のための構造化インデクスの研究開発
平成24年度は主に、この研究のうち(1)音響・音声情報のインデキシング方式の研究開発技術の研究を推進し,音声ドキュメントの検索技術の開発を行い、音声認識システムの辞書に存在しない検索単語の検索を実現する技術開発を行った。また、あらゆる2音節で事前に検索し、それをインデキシングすることによりこの音声ドキュメント検索技術の高速化を実現した。音声ドキュメント検索の研究を評価する上では、研究者が共通で利用できるテストコレクション(検索語,評価用のデータ,正解等)が必要であるため、情報処理学会・音声言語処理研究会の音声ドキュメント処理ワーキンググループのもとで音声ドキュメント検索用と音声中の検索語検出のためのテストコレクションを構築し研究者・企業に公開した。これにより多くの研究者が音声ドキュメント処理の研究に参加するようになり,研究の活性化・推進に大きな貢献を果たした。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

前述したように本研究は以下の4つサブテーマについての研究開発をベースとしている。
(1)音響・音声情報のインデキシング方式の研究開発
(2)映像・音響情報を利用した類似動画検索方式の研究開発
(3)WEB上の情報・知識源を利用した映像情報のインデキシング方式の研究開発
(4)高度・双方向検索のための構造化インデクスの研究開発
平成24年度の予定では、これらの研究要素のうち(1)音響・音声情報のインデキシング方式の研究開発技術の研究を推進することを予定していた。平成24年度は予定通り、音声情報を中心とした検索技術の開発を行い、音声情報のインデキシング技術の実現を果たした。既に平成24年度には映像情報の検索技術の研究にも着手を開始した段階であり、当初の予定通りの達成度状況であると言える。

今後の研究の推進方策

平成25年度以降は、前述した4つのサブテーマについて下記のように(1)~(3)のサブテーマを中心に研究開発を実施する。
(1)平成25年度からは、実際のTV放送プログラムに対して、生活音に対してはその種別識別、音声に対してはキーワード抽出、音楽に対してはジャンル分類と曲識別方式の研究開発を推進する。これにより高精度なインデキシング方式を実現する。ここでの高精度とは7割以上の識別精度、キーワード抽出精度を目標とする。
(2)平成25年度からは、24年度着手した技術をベースとしてTRECVIDのデータ等を用いて実証実験を行い、高精度高速な類似動画の照合技術の開発を進める。
(3)動画像と動画像、静止画像と動画像の類似検索技術の開発を推進する。画像での照合が難しい場合には、(1)より得られた音声情報からの得られるキーワード情報と動画に付加されたテキスト情報の利用も検討する。
本テーマを実際のシステムとして実現するため、平成25年度から、共通の構造化インデクスを用いたプロトタイプシステムを開発に着手する。25年度はテキスト検索要求から、音声情報を用いたビデオ区間検索、および映像による照合ベースの検索システムの設計を行う。

次年度の研究費の使用計画

平成24年度に120万円の直接費用のうち、81,194円を残した。平成25年度は、音響情報の検索技術の開発、映像情報の検索技術の開発を並行して行う。これらを並行して研究開発を行うため、それぞれについての研究開発用のマシンを購入する予定である。

  • 研究成果

    (12件)

すべて 2013 2012

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (11件)

  • [雑誌論文] 音声中の検索語検出のためのテストコレクションの構築と分析2013

    • 著者名/発表者名
      伊藤慶明, 西崎博光, 中川聖一,秋葉友良, 河原達也, 胡新輝,南條浩輝,松井知子, 山下洋一, 相川清明
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.54 No.2 ページ: 471–483

    • 査読あり
  • [学会発表] 音声中の検索語検出におけるサブワードN-gram を用いた高速化2013

    • 著者名/発表者名
      鎌田 圭祐,斉藤 裕之,伊藤 慶明,小嶋 和徳,石亀 昌明,田中 和世,李 時旭
    • 学会等名
      日本音響学会春季季研究発表会
    • 発表場所
      東京工科大学
    • 年月日
      20130313-20130315
  • [学会発表] N-音節事前検索方式における転置インデックス化の検討2013

    • 著者名/発表者名
      斉藤 裕之,伊藤 慶明,小嶋 和徳,石亀 昌明,田中 和世,李 時旭
    • 学会等名
      日本音響学会春季季研究発表会
    • 発表場所
      東京工科大学
    • 年月日
      20130313-20130315
  • [学会発表] 音声検索語検出における識別的スコアリングに関する実験的考察2013

    • 著者名/発表者名
      李 時旭,児島 宏明,田中 和世,伊藤 慶明
    • 学会等名
      日本音響学会春季季研究発表会
    • 発表場所
      東京工科大学
    • 年月日
      20130313-20130315
  • [学会発表] 震災時におけるツイッターのトレンドワードと拡散情報を利用したデマ推定の一考察2013

    • 著者名/発表者名
      須田剛裕,小嶋和徳,伊藤慶明,石亀昌明
    • 学会等名
      情報処理学会第75回全国大会
    • 発表場所
      東北大学
    • 年月日
      20130306-20130308
  • [学会発表] アクティブ探索とPSO を組み合わせたテンプレートマッチング2013

    • 著者名/発表者名
      澤村 誠,小嶋和徳,伊藤慶明,石亀昌明
    • 学会等名
      情報処理学会第75回全国大会
    • 発表場所
      東北大学
    • 年月日
      20130306-20130308
  • [学会発表] 情景画像中の文字抽出における色分解画像の複合による候補画像生成と特徴量補強に関する研究2013

    • 著者名/発表者名
      大原宏太,小嶋和徳,伊藤慶明,石亀昌明
    • 学会等名
      情報処理学会第75回全国大会
    • 発表場所
      東北大学
    • 年月日
      20130306-20130308
  • [学会発表] Experimental Evaluation of Probabilistic Similarity for Spoken Term Detection2013

    • 著者名/発表者名
      Shi-wook Lee, Hiroaki Kojima, Kazuyo Tanaka and Yoshiaki Itoh
    • 学会等名
      International Conference on Pattern Recognition Applications and Methods
    • 発表場所
      Barcelona, Spain
    • 年月日
      20130215-20130218
  • [学会発表] 音声中の検索語検出における音素トライグラム照合による高速抽出法2012

    • 著者名/発表者名
      鎌田 圭祐 , 斉藤 裕之 , 伊藤 慶明 , 小嶋 和徳 , 石亀 昌明 , 田中 和世 , 李 時旭
    • 学会等名
      音声言語処理シンポジウム、研究報告音声言語情報処理(SLP),2012-SLP-94(24),
    • 発表場所
      東京工業大学 大岡山キャンパス
    • 年月日
      20121220-20121221
  • [学会発表] Fast Spoken Term Detection Using Pre-retrieval Results of Syllable Bigrams2012

    • 著者名/発表者名
      Hiroyuki Saito, Yoshiaki Itoh, Kazunori Kojima, Masaaki Ishigame, Kazuyo Tanaka, Shi-wook Lee
    • 学会等名
      Asia-Pacific Signal and Information Processing Association
    • 発表場所
      Hollywood, U.S.A.
    • 年月日
      20121203-20121206
  • [学会発表] N-音節事前検索結果を用いた音声中の検索語検出における上位候補の高速検索2012

    • 著者名/発表者名
      斉藤 裕之,伊藤 慶明,小嶋 和徳,石亀 昌明,田中 和世,李 時旭
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      信州大学
    • 年月日
      20120919-20120921
  • [学会発表] 音声中の検索語検出における候補順位に基づく候補区間のリランキング2012

    • 著者名/発表者名
      紺野 和磨,伊藤 慶明,小嶋 和徳,石亀 昌明,田中 和世,李 時旭
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      信州大学
    • 年月日
      20120919-20120921

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi