研究課題/領域番号 |
26330139
|
研究機関 | 広島市立大学 |
研究代表者 |
田村 慶一 広島市立大学, 情報科学研究科, 准教授 (80347616)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | ビッグデータ / ソーシャル画像データ / データマイニング / 時空間クラスタリング / ソーシャルデータマイニング |
研究実績の概要 |
近年,インターネット上のユーザは日常生活で目にした様々な社会的な事象や話題を携帯電話やスマートフォンに搭載されたカメラ機能で撮影し,撮影した写真を画像データとしてソーシャルメディアサイトへ投稿することで情報発信を行うようになってきている.本研究課題では,ソーシャルメディアサイト上で投稿される画像データをソーシャル画像データと呼び,ソーシャル画像データを用いた動向情報の時空間分析を可能とするための新しい時空間データマイニング技術の確立を目指している.平成26年度は,国内外の研究動向調査を行うとともに,(A)ソーシャル画像データの時空間データモデル化,(B)内容ベースの時空間クラスタリング手法の二つの研究課題に取り組んだ.また,大規模データの収集と,提案手法を実際に実装し,評価も行った.以下に実施項目を示す. (1)ソーシャル画像データの時空間データモデル化:時空間情報に,画像とテキストデータの内容を示す特徴量を加えて,ソーシャル画像データを多次元時空間データとして表現可能な新しい時空間データモデルを作成した. (2)内容ベースの時空間クラスタリング手法:ソーシャル画像データを内容により分類するための新しい内容ベースの時空間クラスタリング手法を開発した.時空間クラスタリング手法として時空間密度に基づくクラスタリング手法を応用し,特徴量空間も考慮したクラスタリング手法として拡張している. (3)大規模データの収集:ソーシャルメディアサイトのAPIを使用して,データ収集を行った.具体的には,Twitterのツイートで投稿画像データに該当する画像URLを含むツイートでかつ,位置情報を含むツイートを収集した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
平成26年度は,国内外の研究動向調査を行うとともに,(A)ソーシャル画像データの時空間データモデル化,(B)内容ベースの時空間クラスタリング手法の二つの研究課題の解決を目標に研究を進め,新しいデータモデルとクラスタリング手法を開発することできた.あわせて,準備検討段階ではあるが,バースト検出手法や並列処理の手法についても検討に入ることができている.また,研究成果を論文誌4件(2件は印刷中)と国際会議8件にて発表することができ,「当初の計画以上に進展している」といえる.
|
今後の研究の推進方策 |
平成27年度は,平成26年度の研究成果を踏まえて,(C)時空間バースト検出手法,(D)大規模ソーシャル画像データの効率的な管理法とその並列処理,に取り組む.平成26年度中に準備を始めている内容について完成度を高めていく.以下に,実施項目別に内容を示す. (1)時空間バースト検出手法:動向情報の時空間上における変化を分析可能とするために,時空間上でのバースト検出手法を応用し,動向情報が各地域でどのように変化しているかを検出可能する新しいバースト検出手法を開発する. (2)大規模ソーシャル画像データの効率的な管理法とその並列処理:時空間情報による索引付けと特徴量空間による索引付けを組み合わせた新しい索引構造を作成する.また,平成26年度~平成27年度までに完成した手法の並列化を行い.平成26度から収集済みの大規模データを用いて性能評価を行う.
|
次年度使用額が生じた理由 |
平成26年度は大規模データ収集のために大容量ディスクの購入を予定していたが,所属機関保有の機器で十分に収集ができたため,購入を見送り,「物品購入費」の一部を国際会議への旅費と,物品購入費の一部をSpringerPlusなどの学術論文誌に採録が決まったため「その他」の経費として活用し,成果発表を優先した.
|
次年度使用額の使用計画 |
本年度は,索引構造の作成と並列処理を予定しているため,物品購入費でマルチコアマシンを購入し,所属機関保有の並列計算機も用いて索引構造と並列処理の評価を行っていく.また,成果発表と各種調査のため旅費を活用する予定である.本年度もデータ収集と実験に補助者が必要であるため謝金を使用して,研究を推進できるように務める.
|