• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

音響と映像の共通インデックスに基づく音響・映像の高度検索技術・双方向検索システム

Research Project

Project/Area Number 24500124
Research InstitutionIwate Prefectural University

Principal Investigator

伊藤 慶明  岩手県立大学, ソフトウェア情報学部, 教授 (90325928)

Co-Investigator(Kenkyū-buntansha) 大川 茂樹  千葉工業大学, 工学部, 教授 (40306395)
田中 和世  筑波大学, 図書館情報メディア研究科(系), 教授 (70344207)
Keywords音声 / 映像 / インデックス / 検索 / 高速 / 高精度
Research Abstract

録画しておいた長大なビデオ群あるいはインターネット上の動画の中から見たい/聞きたい部分間のみを鑑賞したい、というニーズは増大している。ビデオ検索の際には、音や音声等の音響情報をもとに検索したい場合もあれば、映像情報をもとに検索したい場合も生じる。膨大なビデオ情報を、映像・音響情報について検索ができることが望ましい。そこで本研究では以下の4つのサブテーマについて研究開発を実施している。
(1)音響・音声情報のインデキシング方式 (2)映像・音響情報を利用した類似動画検索方式 (3)WEB上の情報・知識源を利用した映像情報のインデキシング方式 (4)構造化インデクス
平成25年度は、4つのサブテーマのうち主に(1)~(2)について、下記のように研究開発を実施した。(1)実際の講演音声データに対して、音声中の検索語を高精度かつ高速に抽出方法として音節バイグラム事前検索方式を研究開発した。音声データをあらゆる音節バイグラムに対して事前に検索しておき、各音節バイグラムには事前検索結果として候補群を保持しておく。検索語が与えられると,検索語中の音節バイグラムの事前検索結果を参照し候補群を少数に決定する.これらの少数の候補群に対してのみ検索語との詳細照合を行うことで検索精度を低下させることなく,最終候補を高速にユーザへ提示できる方式を実現した.また、この最終候補に対してリランキングを行うことでさらに高精度な抽出が可能である方式の研究開発に成功した。これにより当初の目標であった7割以上の識別精度、キーワード抽出精度を達成できた。(2)映像データの高速検索方式として現在音声中の検索語検出における事前検索結果の応用方式の研究開発を進めている。画像の類似検索を実現するため、画像中の文字領域抽出技術の研究開発い、従来手法とし比べ高精度に画像中の文字領域の抽出が行えることを確認した。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

本研究では以下の4つのサブテーマについて研究開発を実施している。
(1)音響・音声情報のインデキシング方式の研究開発
(2)映像・音響情報を利用した類似動画検索方式の研究開発
(3)WEB上の情報・知識源を利用した映像情報のインデキシング方式の研究開発
(4)高度・双方向検索のための構造化インデクスの研究開発
平成25年度の予定では(1)~(3)までを中心に開発予定であった。実際には(1)の音響・音声情報のインデキシング方式の研究開発に関しての研究の進捗が大きく、音声情報のインデキシングの深化が主になされ、学術論文を採録されるレベルに至った(2)についてもこのため来手法とし比べ高精度に画像中の文字領域の抽出が行えることを確認でき、進捗としては十分であったが、(1)(2)に重点がいったため、(3)WEB上の情報・知識源を利用した映像情報のインデキシング方式の研究開発については現在、研究開発を開始した段階であり、当初の予定より若干の遅れと考える。

Strategy for Future Research Activity

平成26年度は最終年度であり、以下の(1)~(4)の4つのサブテーマについて並行してバランスよく研究開発を実施する予定である。なお、映像については研究開発の進捗を考え、まずは静止画を中心として進めていく。
(1)実際の音声や生活音に対して、その種別識別をし音声に対してはキーワードの高速な抽出できる方式の研究開発を推進する。これにより高精度なインデキシング方式を実現する。平成25年度は7割の検索精度を達成したので、検索精度および検索速度においてさらに1割以上の高精度化、高速化の実現を目標とする。
(2)現在、Particle Swarm Optimization for Template Matchingという手法をベースに高精度高速な類似動画の照合技術を開発を進めている。この方式の研究開発を進め、高速高精度な類似画像検索技術を実現する
(3)画像から得られる特徴量と音声から得られる特徴量からテキスト情報を抽出しアノテーションとしての利用方式の検討を進める。
(4)テキストで与えた検索要求に対し、音響,映像を検索方式の高精度化を図るとともに、双方向性を考慮した検索方式を開発する。
本テーマを実際のシステムとして実現するため、共通の構造化インデクスを用いたプロトタイプシステムを開発する。

Expenditure Plans for the Next FY Research Funding

平成26年度は最終年度であるため、プロトタイプシステムの稼動マシン用が必要であるためと成果発表回数が増加するため。
プロトタイプシステムの稼動マシン購入費の一部負担と成果発表費用として使用する計画。

  • Research Products

    (14 results)

All 2014 2013

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (13 results) (of which Invited: 5 results)

  • [Journal Article] 音節N-gramの事前検索結果を利用した音声中の検索語検出の高速化方式2014

    • Author(s)
      伊藤慶明,斉藤裕之,田中和世,李時旭
    • Journal Title

      情報処理学会論文誌

      Volume: 50-2 Pages: 524-533

    • Peer Reviewed
  • [Presentation] 音声中の語彙外検索語の検出における高順位候補を利用したリランキング方式の評価2014

    • Author(s)
      紺野和磨,小嶋和徳,石亀昌明,田中和世,李時旭,伊藤慶明
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      日本大学
    • Year and Date
      20140310-20140312
  • [Presentation] 音声中の辞書外検索語の検出における音素 N グラムによる事前検索方式2014

    • Author(s)
      熊谷真純,小嶋和徳,石亀昌明,田中和世,李時旭,伊藤慶明
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      日本大学
    • Year and Date
      20140310-20140312
  • [Presentation] 音声中の検索語検出における事前検索・HMM状態系列照合・リランキングの適用2013

    • Author(s)
      高橋仁基,伊藤慶明,李時旭,田中和世,小嶋和徳,石亀昌明
    • Organizer
      音声言語処理シンポジウム,電子情報通信学会技術研究報告113 号,366(SP2013 82-95
    • Place of Presentation
      筑波大学
    • Year and Date
      20131219-20131220
  • [Presentation] High Priority in Highly Ranked Documents in Spoken Term Detection2013

    • Author(s)
      Konno Kazuma, Itoh Yoshiaki, Kazunori Kojima, Ishigame Masaaki, Tanaka Kazuyo, Shi-Wook Lee
    • Organizer
      Asia-Pacific Signal and Information Processing Association APSIPA
    • Place of Presentation
      高雄
    • Year and Date
      20131030-20131101
    • Invited
  • [Presentation] 音声中の検索語検出における高順位ドキュメント優先方式の提案2013

    • Author(s)
      紺野 和磨,伊藤 慶明,小嶋 和徳,石亀 昌明,田中 和世,李 時旭
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      信州大学
    • Year and Date
      20130925-20130928
  • [Presentation] 音節バイグラム事前検索方式におけるインデックス容量削減2013

    • Author(s)
      鳴海 司郎,伊藤 慶明,田中 和世,李 時旭
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      信州大学
    • Year and Date
      20130925-20130928
  • [Presentation] 音声検索語検出における認識誤りと性能評価の実験的考察2013

    • Author(s)
      李 時旭,児島 宏明,田中 和世,伊藤 慶明
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      信州大学
    • Year and Date
      20130925-20130928
  • [Presentation] NTCIR-10 SpokenDoc-2 Spoken Term Detection タスクの結果と知見2013

    • Author(s)
      西崎 博光(山梨大),秋葉 友良(豊橋技科大),相川 清明(東京工科大),胡 新輝(NICT),伊藤 慶明(岩手県立大),河原 達也(京大),中川 聖一(豊橋技科大),南條 浩輝(龍谷大),山下 洋一(立命館大)
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      信州大学
    • Year and Date
      20130925-20130928
  • [Presentation] NTCIR-10 SpokenDoc-2 Spoken Content Retrieval タスクの結果と知見2013

    • Author(s)
      秋葉 友良(豊橋技科大),西崎 博光(山梨大),相川 清明(東京工科大),胡 新輝(NICT),伊藤 慶明(岩手県立大),河原 達也(京大),中川 聖一(豊橋技科大),南條 浩輝(龍谷大),山下 洋一(立命館大)
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      信州大学
    • Year and Date
      20130925-20130928
  • [Presentation] Pseudo Real-Time Spoken Term Detection Using Pre-Retrieval Results2013

    • Author(s)
      Yoshiaki Itoh, Hiroyuki Saito, Kazuyo Tanaka, Shi-wook Lee
    • Organizer
      SPECOM
    • Place of Presentation
      Plzen in Czech
    • Year and Date
      20130902-20130905
    • Invited
  • [Presentation] Intensive Acoustic Models Constructed by Integrating Low-Occurrence Models for Spoken Term Detection2013

    • Author(s)
      Shirou Narumi, Kazuma Konno, Takuya Nakano, Yoshiaki Itoh, Kazunori Kojima, Masaaki Ishigame, Kazuyo Tanaka, and Shi-wook Lee
    • Organizer
      INTERSPEECH
    • Place of Presentation
      Lyon, France
    • Year and Date
      20130826-20130829
    • Invited
  • [Presentation] An STD system for OOV query terms integrating multiple STD results of various subword units2013

    • Author(s)
      Kazuma Konno, Hiroyuki Saito, Shirou Narumi, Kenta Sugawara, Kesuke Kamata, Manabu Kon’no, Jinki Takahashi, and Yoshiaki Itoh
    • Organizer
      NTCIR-10
    • Place of Presentation
      国立情報学研究所
    • Year and Date
      20130618-20130621
    • Invited
  • [Presentation] Overview of the NTCIR-10 SpokenDoc-2 Task2013

    • Author(s)
      Tomoyosi Akiba, Hiromitsu Nishizaki, Kiyoaki Aikawa, Xinhui Hu, Yoshiaki Itoh, Tatsuya Kawahara, Seiichi Nakagawa, Hiroaki Nanjo and Yoichi Yamashita
    • Organizer
      NTCIR-10
    • Place of Presentation
      国立情報学研究所
    • Year and Date
      20130618-20130621
    • Invited

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi