研究課題/領域番号 |
26330138
|
研究機関 | 静岡県立大学 |
研究代表者 |
池田 哲夫 静岡県立大学, 経営情報学部, 教授 (60363727)
|
研究分担者 |
武藤 伸明 静岡県立大学, 経営情報学部, 准教授 (40275102)
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
大久保 誠也 静岡県立大学, 経営情報学部, 助教 (90422576)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 情報検索 / 類似検索 |
研究実績の概要 |
本研究は、本研究参画者らの平成23年度からの基盤研究(C)での最重要研究成果「一般化ピボット構築技術」を土台に、より優れた類似検索性能を実現するマルチメディアデータ類似検索技術の確立を目的とするものである。26年度の実績概要を報告する。 1. ピボットベクトルの各要素を独立に高速に改善できることを特徴とする、新たなピボット生成方法を提案し、L1距離を用いたレンジ検索技法の検索性能の向上を図った[PRICAI2014]。実データを対象にして性能評価を行い、提案方法が、従来の代表的な方法よりも優れていることを確認した。 2.可視化結果へのアノテーションを自動付与する手法を提案した[SIG-KBS2014][ JWEIN2014]。提案手法は,最小全域木とオブジェクトの属性情報を用いて,属性分布が大きく変化する部分で領域を分割することにより,与えられたオブジェクト集合をある特徴的な属性を持つオブジェクト部分集合へと分割し,Z-スコアを用いてその集合の特徴をアノテーションとして抽出することを特徴とする。実験により,PCA法、MDS 法などの可視化法による低次元への埋め込み座標情報だけでなく,実際の位置情報に基づく座標情報を扱うデータセットに対しても,オブジェクト集合の特徴抽出が期待できることを確認した。また、[WebDB2014]において、この方法をL1埋め込み手法に拡張し、提案手法は外れ値による影響を受けにくいという良い性質を有することを確認した。 3.変化点間の時系列データの平均値ではなく,中央値を用いてL1 誤差(絶対値誤差)が最小となるような、時系列変化点検出手法を提案した[FIT2014] 。提案法は外れ値による影響を受けにくいという良い性質を有することを確認した。 上記項番1は最終目的に向けての意義の大きい成果である。また、類似検索においては大量データを分かり易く可視化する方法の確立も重要な課題であり、上記項番2の成果は意義の大きい成果である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
我々は研究計画書において具体的な目標(研究期間内に何をどこまで明らかにしようとするのか)として、(1) 固定型分割方式による一般化ピボットでのデータ構造化技術の構築とその性能評価、(2) 学習型分割方式による一般化ピボットでのデータ構造化技術の構築とその性能評価、(3) レンジ検索など各種類似検索も実行可能にした類似検索システムの構築とその性能評価、(4) 提案するデータ構造化技術での探索性能やデータ構造に関する理論的性質の解明、を挙げた。 本年度は3年計画の初年度である。L1距離への埋め込みを用いる手法が予想以上に有用であることが判明し、実績概要でも説明したように、本年度はL1距離への埋め込みを用いる手法に関する研究を精力的に進め、レンジ検索での有用性、可視化での有用性、時系列分析での有用性を明らかにし、外部発表を行うまでにいたった。(1)(2)に関しては外部発表までは至らなかったものの、(3)(4)に関しては第1歩となる成果を挙げたことになる。具体的な目標の達成順番は当初計画と異なるものの、最終目的が優れた類似検索性能を実現するマルチメディアデータ類似検索技術の確立であることを考慮すると、ほぼ順調な進捗であると考える。
|
今後の研究の推進方策 |
平成26年度に引き続き、L1距離への埋め込みを用いる手法の展開を図る。具体的には、(1) 検索クエリにはユーザの嗜好等による分布が存在すると考えられ,このようなクエリ分布を学習データにピボットを構築すれば,各ユーザに対応したピボットが生成され,さらなる類似検索の高速化が見込めると考えられる.この見込みのもと、[PRICAI2014]で提案した方法をベースにクエリ分布を考慮したピボット構築法を新たに考案し有効性を検討する。(2)大量データの有効活用という観点からは類似検索と並んで重要な技術にクラスタリング技術がある。クラスタリングにおいて、前処理でピボットを構築してからクラスタリングを行い処理全体の性能を効率化する方法が現在研究されている。[PRICAI2014]で提案した方法をベースに、クラスタリングの前処理としてのピボット構築法を新たに考案し有効性を検討する。(3)提案した可視化結果へのアノテーションを自動付与する手法[SIG-KBS2014][ JWEIN2014] [WebDB2014]を、多様なマルチメディアデータに適用して有用性を評価する。
|
次年度使用額が生じた理由 |
次年度使用額(13,288円)が生じた理由は、計算機(高性能PCあるいはクライアントPC)の軽微な部品障害が発生した場合に備えて、代替部品購入費を意識的に余したためである。
|
次年度使用額の使用計画 |
次年度使用額(800000円)を併せての、次年度の研究費の使用計画は、消耗品費253288円、旅費560千円(国内学会発表310千円、国際会議発表250千円)、の合計813288円である。
|