• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

音声・音楽情報を利用したビデオデータの自動構造化と検索技術研究

Research Project

Project/Area Number 17500073
Research Category

Grant-in-Aid for Scientific Research (C)

Research InstitutionIwate Prefectural University

Principal Investigator

伊藤 慶明  岩手県立大学, ソフトウェア情報学部, 助教授 (90325928)

Co-Investigator(Kenkyū-buntansha) 大川 茂樹  千葉工業大学, 情報科学部, 助教授 (40306395)
小嶋 和徳  岩手県立大学, ソフトウェア情報学部, 助手 (60305307)
Keywords検索 / ビデオデータ / 構造化 / セグメンテーション / 音声検索 / 音楽 / 音響特徴
Research Abstract

本研究では、ビデオ情報の局所的な特徴、大局的な特徴・分類手法を研究・開発し、ビデオデータ内の自動的なセグメンテーションを第1の目的とし、さらに、セグメンテーションされたクリップ(ビデオのあるまとまった部分区間)同士の局所的・大局的類似性等を利用し、ビデオデータの自動的な構造化を目指すものである。本年度(〜平成18年3月31日)の研究では、まず、音響的な局所的特徴や大局的特徴の研究開発を中心に推進した。音声区間、音楽区間それぞれの判定を行う上で適切な局所的特徴パラメータについて性能比較実験を通して評価し、MFCCおよびクロマベクトル、およびSinusoidal Segmentの利用可能性を確認した。また、これらの局所パラメータを用い、同一楽曲内の同一フレーズや、音声区間内の繰り返される同一言葉等、大局的特徴を抽出する方法としてセグメンタル連続DP法を開発し、その動作を確認するとともに、音声区間と音楽区間のセグメンテーションの自動化を図った。さらに、音声区間が抽出されたものとして、音声区間に対する、音声検索手法についての研究を推進し、新しいサブワードモデルを導入することによって、辞書に依存しない自由な音声検索システムのプロトタイプを実現した。今後は、今年度有効性を確認した音響的な局所的特徴や大局的特徴の抽出方式の深化を目指すと共に、音楽・音声判定方式の高性能化、音声検索の高精度化、および利用者が検索・利用しやすいデータの構造化方式について分析・調査を推進する。この研究のベースとなる音声・音楽等で構成されたビデオデータの整備を行う必要があり、既存のビデオデータ、利用可能なビデオデータの調査、およびビデオデータの構築・公開に関する環境整備について検討していく予定である。

  • Research Products

    (17 results)

All 2006 2005

All Journal Article (17 results)

  • [Journal Article] 語彙フリー音声検索における時間精緻化サブワードモデルの検討2006

    • Author(s)
      岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
    • Journal Title

      日本音響学会講演論文集 1-1-11

      Pages: 21-22

  • [Journal Article] スポッティング区間の再認識に基づく音声検索性能の向上2006

    • Author(s)
      大竹隆之, 岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
    • Journal Title

      日本音響学会講演論文集 1-1-12

      Pages: 23-24

  • [Journal Article] Instantaneous frequencies of signals obtained by the analytic signal method2006

    • Author(s)
      H.Suzuki, F.Ma, H.Izumi, O.Yamazaki, S.Okawa, K.Kido
    • Journal Title

      Acoustical Science and Technology Vol.27,No.3

  • [Journal Article] An Algorithm for Similar Utterance Section Extraction for Managing Spoken Documents2005

    • Author(s)
      Yoshiaki Itoh, Kazuyo Tanaka, Shi-wook Lee
    • Journal Title

      Multimedia Systems 10(5)

      Pages: 432-443

  • [Journal Article] Shift Continuous DP : A Fast Matching Algorithm between Arbitrary Parts of Two Time-Sequence Data Sets2005

    • Author(s)
      Yoshiaki Itoh
    • Journal Title

      Systems and Computers in Japan vol.36,No.10

      Pages: 43-53

  • [Journal Article] An Approach for Retrieving Inquiries in TV Broadcasts in a Disaster2005

    • Author(s)
      Kohei Iwata, Yoshiaki Itoh, Kazunori Kojima, Masaaki Ishigame, Kazuyo Tanaka, Shi-wook Lee
    • Journal Title

      IASTED International Conference on Signal and Image Processing

      Pages: 34-39

  • [Journal Article] 語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用2005

    • Author(s)
      岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
    • Journal Title

      電子情報通信学会研究技術報告 SP2005-21

      Pages: 7-12

  • [Journal Article] 曲内の類似性を用いた曲境界の検出の性能改善2005

    • Author(s)
      岩渕晃, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, Shi-wook Lee
    • Journal Title

      日本音響学会講演論文集 3-7-16

      Pages: 595-596

  • [Journal Article] 彙フリー音声検索におけるサブワードと応用システムの検討2005

    • Author(s)
      岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
    • Journal Title

      日本音響学会講演論文集 1-7-20

      Pages: 31-32

  • [Journal Article] Learning the Correspondence between Continuous Speeches and Motions2005

    • Author(s)
      Natsuki Oka, Arata Nakafushiki, Yoshiaki Itoh
    • Journal Title

      IEEE International Conference on Development and Learning (ICDL)

  • [Journal Article] 音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別2005

    • Author(s)
      谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
    • Journal Title

      電子情報通信学会技術研究報告 SP2004-153

      Pages: 49-54

  • [Journal Article] Knowledge integration in annotation-based collaborative virtual environments2005

    • Author(s)
      S.Aubry, S.Okawa, D.Lenne, I.Thouvenin
    • Journal Title

      インタラクション2005

  • [Journal Article] 生活環境音を記録し音響的特徴を用いて要約するインタフェースの提案2005

    • Author(s)
      大塚昭徳, 伊丹徳重, 坂倉美保, 冨塚清史, 大川茂樹
    • Journal Title

      情報処理学会全国大会 2

      Pages: 374-375

  • [Journal Article] 音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005

    • Author(s)
      谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
    • Journal Title

      日本音響学会講演論文集 3-P-13

  • [Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005

    • Author(s)
      T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
    • Journal Title

      Interspeech2005

      Pages: 589-592

  • [Journal Article] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005

    • Author(s)
      谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
    • Journal Title

      日本音響学会講演論文集 2-6-5

      Pages: 267-268

  • [Journal Article] Knowledge enhanced VR annotating environment for collaborative design2005

    • Author(s)
      S.Aubry, I.Thouvenin, D.Lenne, S.Okawa
    • Journal Title

      Virtual Concept 2005 16-3

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi