• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

音声・音楽情報を利用したビデオデータの自動構造化と検索技術研究

研究課題

研究課題/領域番号 17500073
研究機関岩手県立大学

研究代表者

伊藤 慶明  岩手県立大学, ソフトウェア情報学部, 准教授 (90325928)

研究分担者 大川 茂樹  千葉工業大学, 情報科学部, 准教授 (40306395)
小嶋 和徳  岩手県立大学, ソフトウェア情報学部, 助手 (60305307)
キーワード検索 / ビデオデータ / 構造化 / セグメンテーション / 音声検索 / 音楽 / 音響特徴
研究概要

本研究では、ビデオ情報の局所的な特徴、大局的な特徴・分類手法を研究・開発し、ビデオデータ内の自動的なセグメンテーションを第1の目的とし、さらに、セグメンテーションされたクリップ(ビデオのあるまとまった部分区間)同士の局所的・大局的類似性等を利用し、ビデオデータの自動的な構造化を目指すものである。本年度(〜平成19年3月31日)の研究では、まずビデオデータを分析し,昨年度の研究から得られた音響的な局所的特徴と大局的特徴を用いて,音声区間、音楽区間それぞれの自動判定を行う方式の研究を遂行し,同一楽曲内で繰り返される大局的音響特徴と音楽・音声の局所的音響特徴により音声・音楽の自動セグメンテーション方式を開発した。さらに、抽出された音声区間に対して、テキストあるいは音声を用いて検索語を設定することによりビデオ中の音声データの検索を行う手法(音声検索手法)についての研究を推進した。音素よりもさらに細かくした半音素、1/3音素など従来にない新しいサブワードモデルを開発すると共に、サブワード間の音響的な類似度を導入することによって、辞書に依存しない自由かつ高精度な音声検索システムの研究開発を行った。評価実験を通して、新しいサブワードおよびサブワード間音響類似度の有効性を検証し,国内外の学会で研究発表を行った。今後は、ビデオのセグメンテーション技術の深化を目指すため、音楽・音声判定方式の高性能化、音声検索の高精度化、および利用者が検索・利用しやすいデータの構造化方式について分析・調査を推進する。

  • 研究成果

    (12件)

すべて 2007 2006

すべて 雑誌論文 (12件)

  • [雑誌論文] 語彙非依存型音声文書検索のためのサブワードモデルおよび検索方式の検討2007

    • 著者名/発表者名
      岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, Shi-wook Lee
    • 雑誌名

      第1回音声ドキュメント処理ワークショップ

      ページ: 53-58

  • [雑誌論文] Constructing Spoken Document Processing Systems on a Universal Subphonetic Segment Domain2006

    • 著者名/発表者名
      Kazuyo Tanaka, Shi-wook Lee, Yoshiaki Itoh
    • 雑誌名

      Western Pacific Acoustics Conference 459

      ページ: 4

  • [雑誌論文] A Study of Sophisticated Subword Models on a Time Axis for Open-vocabulary Spoken Document Retrieval2006

    • 著者名/発表者名
      Kohei Iwata, Yoshiaki Itoh, Kazunori Kojima, Masaaki Ishigame, Kazuyo Tanaka, Shi-wook Lee
    • 雑誌名

      Western Pacific Acoustics Conference 483

      ページ: 4

  • [雑誌論文] Two-stage Vocabulary-free Spoken Document Retrieval - Subword Identification and Re-recognition of the Identified Sections -2006

    • 著者名/発表者名
      Yoshiaki Itoh, Takayuki Otake, Kohei Iwata, Kazunori Kojima, Masaaki Ishigame, Kazuyo Tanaka, Shi-wook Lee
    • 雑誌名

      International Conference on Spoken Language Processing (Interspeech)

      ページ: 1161-1164

  • [雑誌論文] Open-Vocabulary Spoken Document Retrieval based on new subword models and subword phonetic similarity2006

    • 著者名/発表者名
      Kohei Iwata, Yoshiaki Itoh, Kazunori Kojima, Masaaki Ishigame, Kazuyo Tanaka, Shi-wook Lee
    • 雑誌名

      International Conference on Spoken Language Processing (Interspeech)

      ページ: 325-328

  • [雑誌論文] A proposal of discrimination method between voice and music using Gaussian mixture models and similarity in a music selection2006

    • 著者名/発表者名
      Takuma Yoshida, Masaaki Ishigame, Yoshiaki Ito, Kazunori Kojima
    • 雑誌名

      Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan

  • [雑誌論文] 音声検索システムのための時間整合を考慮したサブワードモデル構築手法の検討2006

    • 著者名/発表者名
      岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
    • 雑誌名

      情報処理学会 研究技術報告、2006-SLP-062

      ページ: 75-80

  • [雑誌論文] 曲内の類似性とGMMを利用した曲境界判定方式の提案2006

    • 著者名/発表者名
      吉田拓真, 伊藤慶明, 石亀昌明, 小嶋和徳
    • 雑誌名

      音響学会音楽音響研究会

      ページ: 47-52

  • [雑誌論文] ユーザのあいまいな要求を考慮した商品検索システム2006

    • 著者名/発表者名
      西川葉子, 小嶋和徳, 伊藤慶明, 石亀昌明
    • 雑誌名

      平成18年度電気関係学会東北支部連合大会講演論文集 2G11

      ページ: 264

  • [雑誌論文] エリート更新時移民による非同期並列分散遺伝的アルゴリズム2006

    • 著者名/発表者名
      菊池雅彦, 塩田恵美, 小嶋和徳, 伊藤慶明, 石亀昌明
    • 雑誌名

      平成18年度電気関係学会東北支部連合大会講演論文集 1E12

      ページ: 169

  • [雑誌論文] セグメント分割および多点局所探索を用いた画像高解像度化2006

    • 著者名/発表者名
      阿部瑠美子, 千葉澄人, 小嶋和徳, 伊藤慶明, 石亀昌明
    • 雑誌名

      平成18年度電気関係学会東北支部連合大会講演論文集 2E5

      ページ: 177

  • [雑誌論文] ニュース番組の情報を利用したスポーツ実況中継のハイライトシーン抽出法2006

    • 著者名/発表者名
      榊重信, 伊藤慶明, 小嶋和徳, 石亀昌明
    • 雑誌名

      平成18年度電気関係学会東北支部連合大会講演論文集 2E19

      ページ: 191

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi