研究課題/領域番号 |
26350355
|
研究機関 | 石川工業高等専門学校 |
研究代表者 |
金寺 登 石川工業高等専門学校, その他部局等, 教授 (50194931)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 教材情報システム / 音声情報内容検索 / コンテンツ補完 |
研究実績の概要 |
ネットワークの普及により,自学自習や生涯学習に有効な教材や情報をネットワーク経由で入手可能である。しかし,あまりにも多くの情報があるために,必要な教材や情報を入手するには多くの時間と労力を要する。特に,ビデオ中から必要なシーンを即座に閲覧することは,非常に困難である。そこで,ビデオ中から話題情報を多く含む音声情報を抽出し,音声認識した情報を用いて講義ビデオを検索するシステムを開発することとした。これにより,これまで時間と労力を要した作業が即座に自動的に行われるため,利用者は学習内容に集中できる。また,学習内容について,ビデオ情報を含むいろいろな情報から学習できるため,多面的に学習内容をとらえることができる。対象となる教材は日本に限らず世界中に存在するため,各種知識を統合することにより,英語のビデオ教材も検索にできるようする。 平成26年度は,国内の複数の教育機関のビデオ教材を収集し,システム性能を評価する環境を整備した。また自動収集結果と人間による収集結果を精度と速度の面で比較した。その結果,検索対象の先頭シーン,前後のシーン,全体のシーンを線形補完したコンテンツ補完が注目しているシーンによる関連音声内容検索においても有効であることが確認された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
下記のように予定通り、研究を実施し、予定の成果が得られた。 [4月~]複数の教育機関のビデオ教材,講義資料を収集。[7月~9月]シーン間情報検索性能評価環境の整備。[7月~9月]人間によるビデオ教材各シーン間の関連の取得。[9月~11月]これまでの研究成果によるシステム性能評価。[12月~2月]各種知識情報の統合によるシステム性能評価。[3月] 国内の講義シーン間での関連音声内容検索システム性能に適した方法を検証。 従来の質問文による検索とシーン間検索の性能比較を行った。特に検索方法による違いについて検討した。一般的に情報検索に用いられるTF-IDF値を並べたベクトル間の内積を用いる方法に加えて,辞書,Wordnetを用いたキーワード補完,コンテンツ補完の効果を調査した。その結果,通常の質問文による結果と同様にコンテンツ補完の検索性能が高いことがわかった。特に検索対象の先頭シーン,前後のシーン,全体のシーンを線形補完したコンテンツ補完が有効であることが統計的に検証できた。
|
今後の研究の推進方策 |
平成26年度には,国内の複数の教育機関のビデオ教材を収集し,システム性能を評価する環境を整備及び評価を実施した。平成27年度は,海外のビデオ教材各シーンと国内のビデオ教材各シーン間の関連を以下のように調査する。 [4月~6月]海外のビデオ教材を収集する。[7月~9月]海外のビデオ教材を音声認識し,自動翻訳する。[7月~9月]人間がどのような手順と思考で海外と国内ビデオ教材各シーンの対応をとるかを調査する。[10月~12月]各種知識情報の統合によるシステム性能評価する。WordNet及び日本語WordNetの下位概念, 英語及び日本語WikiPediaの解説と関連項目,一般辞書など,各種知識情報を統合し,海外及び国内の教育機関のビデオ教材各シーン間の関連を自動収集する。自動収集結果と人間による収集結果を精度と速度の面で比較する。[10月~2月]人間の思考過程を取り入れ,システムを改善する。[3月]海外及び国内の教育機関のビデオ教材に対して,各シーン間の関連検索性能,キーワード補完・コンテンツ補完・サブワード検索による効果,言語による違い,各種知識源の統合方法と効果,人間の検索手順と思考の傾向,人間の思考を利用した効果について,中間報告する。
|
次年度使用額が生じた理由 |
消耗品購入時に予算を超えないように少なめに購入した結果,4,402円の残額が生じた。昨年度購入を控えていた消耗品を含めて今年度購入したい。
|
次年度使用額の使用計画 |
設備備品費 800千円 (クラスタサーバ(4台で構成)・4台×200千円),消耗品費 204千円(ビデオ保存用HDD(10台) 200千円),旅費 250千円(研究打ち合せ・資料収集250千円),謝金等 50千円(国内外関連ビデオシーン間検索作業(内訳:5人×2時間×30講義分)) 計 1,304千円
|