• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

大規模・異種の時空間データ統合で生じる矛盾を許容するサイエンスクラウド基盤

Research Project

Project/Area Number 24240015
Research Category

Grant-in-Aid for Scientific Research (A)

Research InstitutionNational Institute of Advanced Industrial Science and Technology

Principal Investigator

小島 功  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究グループ長 (00356982)

Co-Investigator(Kenkyū-buntansha) 北川 博之  筑波大学, システム情報工学研究科(系), 教授 (00204876)
的野 晃整  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (10443227)
油井 誠  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (10586712)
横山 昌平  静岡大学, 情報学部, 講師 (20443236)
石川 博  静岡大学, 情報学部, 教授 (60326014)
天笠 俊之  筑波大学, システム情報工学研究科(系), 准教授 (70314531)
中村 章人  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (70357664)
岩田 健司  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (80549890)
川島 英之  筑波大学, システム情報工学研究科(系), 講師 (90407148)
LYNDEN Steven  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (30528279)
Project Period (FY) 2012-04-01 – 2015-03-31
Keywordsデータ統合 / 問い合わせ処理 / 矛盾 / Provenance / Linked Data / 画像解析 / 異常検出 / 機械学習
Research Abstract

本年度は初年度として、矛盾を扱うための要素技術として 1)統合のモデル化とアーキテクチャ、2)時空間データの解析とワークフロー、3)検索と解析のための並列処理基盤の3点を中心として研究開発を行い、以下のような実績を得た。
1) モデル化:新たな問題であるので周辺研究の調査/評価を行い、メタデータに基づくProvenance(来歴情報)に基づくモデル化の有効性を確認した。応用としてホットスポット解析や土地利用検出などの画像処理を中心として矛盾の事例を共通的に扱うこととし、次年度以降の技術連携の基礎とした。曖昧性や不確実性のあるデータ集合に対し距離に基づく外れ値の検出手法を提案し、有効性を検証した。
2) 解析:1)に従い要素研究を進めた。火事などのホットスポット解析についてはGEO Gridの熱赤外線画像を用いた温度に基づく効率的な検出手法を提案し、有効性を確認した。また、不確実性のあるデータに対するGPUを用いた高速化処理を提案し、これも実験で有効性を検証した。土地利用検出としては写真画像の機械学習による自動分類の手法を構築し、分類における研究課題を発見した。また同じく写真画像に対し、撮影方向を意識して対象の検知を高精度化する方法を提案、有効性を示した。解析の手順を容易にワークフロー化できるツール(lavatube2)を研究開発し、実際に画像の差分検知に用いて有効性を検証した。
3)並列処理:分散環境におけるメタデータ(Linked Data)の分散問い合わせの効率化手法を提案した。またこれら検索結果をOLAP的に解析するためのフレームワークを研究開発した。結合などメタデータの処理の効率化をダイジェストデータを使って効率化する方法の研究開発に着手した。解析のための機械学習のフレームワークをHadoop上に構築しVowpal Wabbit等との比較検証を行って有効性を示した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度として要素研究を中心に研究開発を行い、それぞれの進捗には大きな成果が上がったものや予定通りでないものなどがあるが、全体としては順調に進展していると考えている。
1)のモデル化は進捗が十分でないが、Provenanceの可能性を検証できた点は大きく、翌年以降の発展が期待できる。また不確実性のデータに対する外れ値検出は予想以上の進捗である。
2)の解析については全体的に大きく進展したところであり、全体としての成果は予定以上のものがある。ホットスポット解析や土地利用解析は計画通りの進捗であり、GPUによる画像処理や、撮影方向を用いた対象物の検出は計画以上の成果を得ている。ワークフローシステムを用いた差分検出のプロトタイプはプレス発表やデモ展示を行って様々な反響を得ている。
3)の並列処理についても同様で、Linked Dataについての研究進展は当初想定以上の広がりが出ている。空間データなど結合処理の効率化については予定した成果が得られていないが、この過程で格納構造を効率化する方法が得られ発表している。また機械学習のフレームワークについても地球観測応用には適用できていないが、広告測定などビジネス応用についてはその有効性を確認できており、要素技術研究として十分な結果を得ていると判断している。またメタデータ検索の標準仕様もまとめることができた。
研究の進捗体制:十分な体制で遂行できたと考える。遠隔地を含むためにテレビ会議に基づくものを定例化し、今年度は9回(定例8回+講演会1回)の会合を行って進捗の確認や研究成果を議論するなど十分な体制の元で進めた。内部向けデータ共有サイトやMLなどど情報の共有にも務めた。

Strategy for Future Research Activity

次年度は要素研究の推進とともに各要素研究の融合や連携のための議論を進めることとしている。特に、以下の2点において研究の連携の可能性がはっきりしてきたので、これらの研究開発を推進めることとする。
1)写真画像解析による土地利用検出:産総研の機械学習による画像のクラスタリングと、静岡大の特定タグや特定の特徴量(撮影方向など)に着目した画像解析は相補的であるので、個々の要素研究の進展とあわせ、組み合わせによる効率の向上が望めるか研究・検証する。
2)Linked Dataの管理検索基盤:産総研における分散Linked Data検索や空間結合データ処理と、筑波大におけるLinked Dataの解析のためのOLAPフレームワークは大規模なメタデータから知見を求めるために有効な技術であるので、組み合わせて新たな成果が得られる可能性があり、これも研究をすすめる。
衛星データやセンサなど膨大なデータ(ビッグ・データ)を扱う環境において、本テーマで扱うデータの相反やズレといった「矛盾」が膨大に発生することは常態化すると考えられる。ここで正確なデータや精密な校正を行って一貫性のあるデータ集合を作ることはビッグデータの環境において現実的でなく、いかにこのような「矛盾」を許容しつつ高速かつ簡便に意味のあるデータ統合を行うかが重要である。本テーマのこの主張はこれから重要性が増す一方と認識しており、この立場をふまえつつ研究を推進していく予定である。

  • Research Products

    (25 results)

All 2013 2012 Other

All Journal Article (8 results) (of which Peer Reviewed: 7 results) Presentation (16 results) Book (1 results)

  • [Journal Article] 高解像度フォトモザイク生成のための並列分散画像検索手法2013

    • Author(s)
      横山 昌平, 石川 博
    • Journal Title

      電子情報通信学会和文論文誌D データ工学と情報マネジメント特集

      Volume: Vol.J96-D, No.5 Pages: 未定

    • Peer Reviewed
  • [Journal Article] LODのOLAP分析を可能にするETLフレームワークの提案2013

    • Author(s)
      井上寛之, 天笠俊之, 北川博之
    • Journal Title

      日本データベース学会論文誌

      Volume: Vol.12, No.1 Pages: 未定

    • Peer Reviewed
  • [Journal Article] 動的タイムワーピング距離を用いたX線天文データの類似検索2013

    • Author(s)
      林史尊,天笠俊之,北川博之,海老沢研,中平聡志
    • Journal Title

      宇宙科学情報解析論文誌

      Volume: Vol.2 Pages: 19-27

  • [Journal Article] An ETL Framework for Online Analytical Processing of Linked Open Data2013

    • Author(s)
      Hiroyuki Inoue, Toshiyuki Amagasa, Hiroyuki Kitagawa
    • Journal Title

      Proceedings of the 14th International Conference on Web-Age Information Management (WAIM'13)

      Volume: LNCS Pages: 未定

    • Peer Reviewed
  • [Journal Article] Paragraph Tables: A Storage Scheme Based on RDF Document Structure2012

    • Author(s)
      Akiyoshi Matono, Isao Kojima
    • Journal Title

      Proc of 23rd International Conference on Database and Expert Systems Applications (DEXA), 2012 (LNCS)

      Volume: 7446 Pages: 231-247

    • DOI

      10.1007/978-3-642-32597-7_21

    • Peer Reviewed
  • [Journal Article] Distance-based Outlier Detection on Uncertain Data of Gaussian Distribution2012

    • Author(s)
      Salman Shaikh, Hiroyuki Kitagawa
    • Journal Title

      Proc.of 14th Asia-Pacific Web Conference (LNCS)

      Volume: 7235 Pages: 109-121

    • DOI

      10.1007/978-3-642-29253-8_10

    • Peer Reviewed
  • [Journal Article] Extracting Hot Spots from Satellite Data2012

    • Author(s)
      Hideyuki Kawashima, Chunyong Wang, Hiroyuki Kitagawa
    • Journal Title

      Proc. of Scientific and Statistic Database Management(LNCS)

      Volume: 7338 Pages: 581-586

    • DOI

      10.1007/978-3-642-31235-9_39

    • Peer Reviewed
  • [Journal Article] A Robust Clustering Method for Missing Metadata in Image Search Results2012

    • Author(s)
      Masaharu Hirota, Naoki Fukuta, Shohei Yokoyama, Hiroshi Ishikawa
    • Journal Title

      Journal of Information Processing

      Volume: Vol.53, NO.5 Pages: 537-547

    • DOI

      10.2197/ipsjjip.20.537

    • Peer Reviewed
  • [Presentation] GPU acceleration of probabilistic frequent itemset mining from uncertain databases

    • Author(s)
      Yusuke Kozawa, Toshiyuki Amagasa, Hiroyuki Kitagawa
    • Organizer
      21st ACM international conference on Information and knowledge management (CIKM '12)
    • Place of Presentation
      Maui(Hawaii,USA)
  • [Presentation] Discovering Multiple HotSpots using Geo-tagged Photographs

    • Author(s)
      Motohiro Shirai, Masaharu Hirota, Shohei Yokoyama, Naoki Fukuta, Hiroshi Ishikawa:
    • Organizer
      SIGSPATIAL 2012 International Conference on Advances in Geographic Information Systems
    • Place of Presentation
      Redondo Beach(California,USA)
  • [Presentation] Application to Earth Observation of a Workflow System Based on HTML5

    • Author(s)
      岩田健司、小島功、中村良介、中村章人
    • Organizer
      The 1st International Workshop on Cloud Computing and Applications
    • Place of Presentation
      Harbor plaza 8 degrees(香港)
  • [Presentation] クラウドによる画像解析ミドルウェアLavatube 2

    • Author(s)
      岩田健司、小島功、佐藤雄隆
    • Organizer
      ビジョン技術の実利用ワークショップViEW2012
    • Place of Presentation
      パシフィコ横浜 (神奈川県横浜市)
  • [Presentation] Lavatube 2の地理空間情報サービス連携による衛星画像解析

    • Author(s)
      岩田健司,小島功,中村良介,喜多恭代,中村章人
    • Organizer
      動的画像処理実利用可ワークショップ2013
    • Place of Presentation
      静岡大学浜松キャンパス(静岡県浜松市)
  • [Presentation] MapReduceによる確率的勾配降下法を用いた広告クリック率予測の実践

    • Author(s)
      後藤 康路, 油井 誠, 横山 昌平, 小島 功, 石川 博
    • Organizer
      第155回データベースシステム研究発表会
    • Place of Presentation
      秋葉原ダイビル(東京都)
  • [Presentation] Distance-based Outlier Detection on Uncertain Data of Bounded Gaussian Distribution

    • Author(s)
      Salman Ahmed Shaikh
    • Organizer
      The 4th International Workshop with Mentors on Databases, Web and Information Management for Young Researchers (iDB2012)
    • Place of Presentation
      名古屋大学(愛知県名古屋市)
  • [Presentation] Reranking Image Search Result Based On Photographic Quality Assessment Without Image Features

    • Author(s)
      Masaharu Hirota, Shohei Yokoyama, Naoki Fukuta, Hiroshi Ishikawa
    • Organizer
      IADIS International Conference WWW/Internet 2012
    • Place of Presentation
      Madrid(Spain)
  • [Presentation] 波形の類似性を考慮した大規模月地震データの可視化システムの実装

    • Author(s)
      後藤康路,山田竜平,山本幸生,横山昌平,石川博
    • Organizer
      平成24年度 宇宙科学情報解析シンポジウム
    • Place of Presentation
      JAXA相模原キャンパス(神奈川県相模原市)
  • [Presentation] 道路ネットワークを用いたGPS軌跡の特徴点を保持する圧縮アルゴリズムの提案

    • Author(s)
      原木 司, 廣田 雅春, 横山 昌平, 石川 博
    • Organizer
      ARG 第1回Webインテリジェンスとインタラクション研究会
    • Place of Presentation
      神奈川県近代文学館(神奈川県横浜市)
  • [Presentation] Top-k Distance-based Outlier Detection on Uncertain Dataset

    • Author(s)
      Salman Ahmed Shaikh
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム (DEIM フォーラム2013)
    • Place of Presentation
      ホテル華の湯(福島県郡山市)
  • [Presentation] LODのOLAP分析を可能にするETLフレームワークの提案

    • Author(s)
      井上寛之,天笠俊之,北川博之 2013年3月3日
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2013)
    • Place of Presentation
      ホテル華の湯(福島県郡山市)
  • [Presentation] 複数GPUによる確率的頻出アイテム集合マイニングの高速化

    • Author(s)
      小澤佑介,天笠俊之,北川博之
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2013)
    • Place of Presentation
      ホテル華の湯(福島県郡山市)
  • [Presentation] タグの時空間情報を考慮したジオタグ付き写真の可視化システムの開発

    • Author(s)
      大森 雅己, 廣田 雅春, 横山 昌平, 石川 博
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2013)
    • Place of Presentation
      ホテル華の湯(福島県郡山市)
  • [Presentation] ジオタグ付き写真を用いた地図の彩色システムの構築

    • Author(s)
      大羽 洋隆, 廣田 雅春, 横山 昌平, 石川 博
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム 2013)
    • Place of Presentation
      ホテル華の湯(福島県郡山市)
  • [Presentation] ジオタグ付き写真を用いたホットスポットの分類とランドマークの形状抽出手法

    • Author(s)
      白井 元浩, 廣田 雅春, 横山 昌平, 石川 博
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム 2013)
    • Place of Presentation
      ホテル華の湯(福島県郡山市)
  • [Book] Web Services Data Access and Integration - The RDF(S) Realization (WS-DAIRDFS) RDF(S) Querying Specification2013

    • Author(s)
      Isao Kojima, Said Mirza, Steven Lynden
    • Total Pages
      42
    • Publisher
      Open Grid Forum

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi