2011 年度実施状況報告書

無音の動画像ショットへの音貼り付け技術の研究

研究課題

研究課題/領域番号	23500114
研究機関	電気通信大学
研究代表者	尾内理紀夫電気通信大学, 情報理工学(系)研究科, 教授 (70323871)
研究分担者	岡部誠電気通信大学, 情報理工学(系)研究科, 助教 (40557211)
研究期間 (年度)	2011-04-28 – 2014-03-31
キーワード	マルチメディア技術
研究概要	2種類のシステムを作成した。一つは、効果音を鳴らすタイミングや音量・再生時間の調節を半自動的に行うことで、動画製作における作業時間を短縮する効果音付加支援システムである。ユーザは付加させたい効果音と動画を読み込ませる。次に音が鳴る源となる物体（例：バウンド音を付加させたいならばボール）を選択する。物体を選択した後、検出したいタイミングとして、バウンド音のように物体の軌道・速度が変化したときに鳴る音の場合と、花火の音のように物体が出現もしくは消滅したときに鳴る音の場合のどちらかを選択する。その後、システムがタイミングを算出する。物体を選択しなければ、汽笛の音のように物体の動きに左右されずに鳴る音と判断し、ユーザが指定した区間内にランダムに配置、もしくはその区間に合うように効果音の再生時間の調節を行う。なお、入力動画に既に音が入っていた場合、その音と効果音がどちらも聞こえるように付加を行う。タイミングを算出した後、検出できなかったタイミングの付加や余分な場所の削除、音量の調節を行い、効果音付加動画として出力する。物体の速度を検出するために、Kalalらによって提案されたTLD（Tracking Learning Detection）を物体追跡手法として使用した。もう一つのシステムでは、類似した動きの物体は類似した音を発するという仮定に立ち、音の貼り付けを行う。システムは、まず既存の音付き動画と無音動画を読み込み、それぞれの動画から画像特徴量を抽出する。続いて、無音動画の画像特徴量と既存の音付き動画の画像特徴量とのマッチングをとり、類似した部分の対応付けを行う。マッチング結果を基に、音データを切り抜いて、無音動画に貼り付ける。画像特徴量としてはオプティカルフローを採用した。ボールのバウンドの例では、音が適切な箇所に貼り付けられることを確認した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 2種類のシステムを研究開発した。前処理部は計画通りに既存技術を用いた。検索のための特徴量としてはオプティカルフローを採用した。音と動画の対応を取る編集手法としては、各種の手法を検討し、物体の速度検出に，Kalalらによって提案されたTLD（Tracking Learning Detection）という手法を利用し、物体の出現・消滅の検出にはテンプレートマッチングを採用した。ボールのバウンド音、車の走行音、靴音などの音をデータベース化し、類似性などの判定にはソナグラムを使用した。研究成果として2編の論文を外部発表した。この内の一編である第4回データ工学と情報マネジメントに関するフォーラム(DEIM2012)にて発表した論文は、学生奨励賞を受賞した。
今後の研究の推進方策	おおむね計画どおりに推進する予定である。23年度では特徴量として各フレーム画像におけるオプティカルフローを用いた。24年度では、カメラ移動の考慮、オブジェクト以外の背景の除去、自然な貼り付け音を生成するための手法の検討といった編集部の改良を目指す。また、前処理部においては音の同期に対応する手法の検討を行うととともに、音データベースも拡充する。
次年度の研究費の使用計画	おおむね当初の予定どおりに研究費を使用する計画である。

研究成果
(2件)

すべて学会発表 (2件)

[学会発表] 無音動画に対する効果音貼付けシステムの試作2012
- 著者名/発表者名
  鈴木喜也, 岡部誠, 尾内理紀夫
- 学会等名
  情報処理学会データベースシステム研究会
- 発表場所
  シーサイドホテル舞子ビラ神戸(兵庫県)
- 年月日
  2012-03-04
[学会発表] 動画への効果音付加支援システムの作成2012
- 著者名/発表者名
  森下沙耶, 岡部誠, 尾内理紀夫
- 学会等名
  社団法人映像情報メディア学会メディア工学研究会
- 発表場所
  関東学院大学(神奈川県)
- 年月日
  2012-02-18