• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

大規模・異種の時空間データ統合で生じる矛盾を許容するサイエンスクラウド基盤

Research Project

Project/Area Number 24240015
Research InstitutionNational Institute of Advanced Industrial Science and Technology

Principal Investigator

小島 功  独立行政法人産業技術総合研究所, 情報技術研究部門, 総括研究主幹 (00356982)

Co-Investigator(Kenkyū-buntansha) 北川 博之  筑波大学, システム情報工学研究科(系), 教授 (00204876)
的野 晃整  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (10443227)
油井 誠  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (10586712)
横山 昌平  静岡大学, 情報学研究科, 講師 (20443236)
LYNDEN Steven  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (30528279)
石川 博  首都大学東京, システムデザイン学部, 教授 (60326014)
天笠 俊之  筑波大学, システム情報工学研究科(系), 准教授 (70314531)
中村 章人  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (70357664)
岩田 健司  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (80549890)
川島 英之  筑波大学, システム情報工学研究科(系), 講師 (90407148)
Project Period (FY) 2012-04-01 – 2015-03-31
Keywordsデータ統合 / 問い合わせ処理 / 矛盾 / 科学データ / Linked Open Data / 画像解析 / 機械学習 / 異常値検出
Research Abstract

2年目として要素研究とそれ同士の統合を並行して進め、以下の実績を得た。
1) モデル化とアーキテクチャ:矛盾に対し異種データ(実世界データとSNS等)の間に疑似相関関係を指定して扱う方法を考案し、アカデミック分野の異種データにおいて原因の発見や将来予測がある程度可能なことを確認した。来歴情報(Provenance)については脆弱性の応用を発見した。曖昧性や不確実性を有するデータ集合に対する外れ値検出手法を拡張し、トップK件の外れ値を効率的に検出する手法を提案、検証した。
2)画像解析とワークフロー・可視化:機械学習による画像解析はサブクラス化により改良し、衛星画像処理よりも高精度の判別を実現した。SNS上の地理情報に着目し、ユーザが付与した位置情報(ジオタグ)を基に知見獲得を行う方法の研究を進め、海岸が写った写真のジオタグから海岸線を検出する等、注目するポイントの自動判定等を実現した。ワークフローと可視化はLavatubeの応用を進め、動画像や衛星画像等の処理の実行状況がクライアントで可視化、中断、逐次実行できる対話性を実現した。
3)検索・解析のための基盤技術:LODに対する分散処理は、時間制限内でベストエフォートの答えを戻す手法を考案し、デモシステムを構築した。配列データに対するウィンドウ集約処理に対し、差分計算の概念を導入して高速化、計算量の効率化を実証した。不確実データを対象とした確率的頻出アイテム集合マイニングアルゴリズムの並列分散化を行うと共に,GPUに基づくソートおよびCanopyクラスタリングの手法を開発した。
4)連携:技術を統合する応用を構築した。特にLODの検索と可視化を組み合わせた放射線モニタリングの応用がLODチャレンジで受賞した。2)の機械学習で発生する特定パターンの誤判定について、Flickrの画像解析を応用することが有効であることも解明した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

2年目として順調に進展していると考える。
1)のモデル化は、矛盾のモデル化における疑似相関関係に基づく手法は将来予測や原因究明に対して一定の有効性が検証でき、これは有益な結果と言える。外れ値検出のモデルも有効性が検証でき予定通りの進捗である。Provenanceの研究進捗は十分ではないが、適用分野を発見できたので今後の進捗が期待できる。
2)の画像処理は大きく進展しており、機械学習による方法も改良により精度の高い判別結果を得ることができ、大規模化と今後の改良でさらなる向上が期待される。また、これと相補的な手法である海岸線や注目点といった個別のデータに着目した解法もDEIMでの発表が複数受賞した等十分以上の成果を得たと言え、これら2つの今後の組み合わせに期待が持てるものと判断する。ワークフローは企業の利用につなげることができ、衛星データ利用に基づくデモ展示等でも好評でこれも発展が期待できる状況である。
3)基盤技術については、LODに対して時間内に必ず一定の答えを返すベストエフォート型の検索を考え、それと答えの正確さを同時に提供するというアイデアは大きな成果であり、分散したLODの検索を実用的にするために非常に重要な技術と評価する。またデモシステムも構築して国際会議で発表もできた。配列データの扱いについてはウィンドウを使った集約演算という問題領域を明確化して実証できた点は意味のある進捗と考える。GPUについても同様に予定通りの進捗と言える。当初予定していた結合演算等については十分な進捗がないが、予備実験等は重ねているので今後の進捗が期待できる。
4)連携については、特に放射線データベースを応用としてLOD化とその検索、解析、可視化という一連の流れを実現する応用を構築できた点で進捗があったと考え、これは受賞の実績からして十分なものと評価する。

Strategy for Future Research Activity

基本的に要素技術の進捗は十分であるので、現在の方向性と広がりを維持しつつ最終年度での成果とりまとめや統合を進めていく予定である。そのために特に以下の点に留意して研究を推進する予定である。
1)画像解析による土地利用における連携:これは初年度に基本的な方向性が確認できたが、今年度において有益性が明確になった。従って各要素技術の改良や熟成と並行して統合的に実証を行って実証する予定である。
2)LODの検索や解析における連携:これは応用の実現として一定の成果を得たが、実用性の高い技術とすべく改良を行う必要がある。特に基盤技術の高速化研究がまだ十分取り込めていないので、これらの成果を取り込むことで実用性の高い応用サービスを提供する方針である。
3)モデル化についてはSNSと画像といったような特定のパターンを共通課題として手法の連携可能性を検討する計画である。特にSNSのデータについては、最終年度は分担者を増強することで一層の進捗をはかる予定である。
4)連携については、以上のように、「矛盾」したサイエンスデータのクラウド環境のための要素研究や統合研究は非常に多岐にわたるので、最終的な統合のイメージが見えにくいが、いくつかのトピックで確実に連携的な成果を出して行くことで全体としての統合を推進していく予定である。
これらの多様な研究成果はビッグデータの時代にとって重要なもので、特にばらつきや相反のある異種のデータを効果的に結び付けたり可視化したりすることでデータ統合を効率化する、という本研究の視点は極めて意味があると考える。ひきつづきこの立場をふまえつつ研究を推進して最終的な成果のとりまとめを行っていきたい。

  • Research Products

    (35 results)

All 2014 2013 Other

All Journal Article (9 results) (of which Peer Reviewed: 9 results) Presentation (23 results) (of which Invited: 2 results) Remarks (3 results)

  • [Journal Article] Top-k Outlier Detection from Uncertain Data2014

    • Author(s)
      Salman Shaikh, Hiroyuki Kitagawa
    • Journal Title

      International Journal of Automation and Computing (IJAC)

      Volume: 11 Pages: 128-142

    • DOI

      10.1007/s11633-014-0775-8

    • Peer Reviewed
  • [Journal Article] A Hybrid Approach to Linked Data Query Processing with Time Constraints2013

    • Author(s)
      Steven Lynden, Isao Kojima,Akiyoshi Matono, Akihito Nakamura, Makoto Yui
    • Journal Title

      Proc.of Linked Data on the Web 2013 ( WWW 2013 Workshop) CEUR-WS

      Volume: 996 Pages: 1-10

    • Peer Reviewed
  • [Journal Article] Best-effort Linked Data Query Processing with Time Constraints using ADERIS-Hybrid2013

    • Author(s)
      Steven Lynden,Isao Kojima, Akiyoshi Matono,Akihito Nakamura
    • Journal Title

      Proc of International Semantic Web Conference(ISWC) CEUR-WS

      Volume: 1035 Pages: 29-32

    • Peer Reviewed
  • [Journal Article] Image processing workflow middleware to archive high performance and usability2013

    • Author(s)
      Kenji Iwata, Yutaka Satoh, Isao Kojima
    • Journal Title

      Proc, of the 2013 International Conference on Image Processing, Computer Vision and Pattern Recognition

      Volume: Vol.1 Pages: 146-150

    • Peer Reviewed
  • [Journal Article] Tag and Topic Recommendation Systems2013

    • Author(s)
      Agnes Bogardi-Meszoly, Andras Rovid, Hiroshi Ishikawa, Shohei Yokoyama, Zoltan Vamossym
    • Journal Title

      Acta Polytechnica Hungarica, Journal of Applied Sciences

      Volume: Vol. 10, No. 6 Pages: 171-191

    • Peer Reviewed
  • [Journal Article] 高解像度フォトモザイク生成のための並列分散画像検索手法2013

    • Author(s)
      横山 昌平, 石川 博
    • Journal Title

      電子情報通信学会和文論文誌D, データ工学と情報マネジメント特集

      Volume: Vol.J96-D No.5 Pages: 1290-1299

    • DOI

      10.12700/APH.10.06.2013.6.10

    • Peer Reviewed
  • [Journal Article] A method of area of interest and shooting spot detection using geo-tagged photographs2013

    • Author(s)
      Motohiro Shirai, Masaharu Hirota, Hiroshi Ishikawa, Shohei Yokoyama
    • Journal Title

      Proc. of ACM SIGSPATIAL Workshop on Computational Models of Place 2013

      Volume: 1 Pages: 34-42

    • DOI

      10.1145/2534848.2534854

    • Peer Reviewed
  • [Journal Article] Fast Top-k Distance-based Outlier Detection on Uncertain Data2013

    • Author(s)
      Salman Shaikh, Hiroyuki Kitagawa
    • Journal Title

      Proc. 14th International Conference on Web-Age Information Management(WAIM 2013)(LNCS)

      Volume: 7923 Pages: 301-313

    • DOI

      10.1007/978-3-642-38562-9_31

    • Peer Reviewed
  • [Journal Article] Parallel and Distributed Mining of Probabilistic Frequent Itemsets Using Multiple GPUs2013

    • Author(s)
      Yusuke Kozawa, Toshiyuki Amagasa, Hiroyuki Kitagawa
    • Journal Title

      Proc. of DEXA 2013

      Volume: 8055 Pages: 145-152

    • DOI

      10.1007/978-3-642-40285-2_14

    • Peer Reviewed
  • [Presentation] GEO Gridを活用したデータベース連携による放射線モニタリング2013

    • Author(s)
      田中良夫、小島功、中村章人、的野晃整
    • Organizer
      産総研オープンラボ
    • Place of Presentation
      つくば
    • Year and Date
      20131031-20131101
  • [Presentation] Implementation of the Fukushima Radiation LOD Framework

    • Author(s)
      Isao Kojima, Yoshio Tanaka Akiyoshi Matono Akihito Nakamura
    • Organizer
      W3C Linking Geospatial Data Workshop
    • Place of Presentation
      London, Campus London
  • [Presentation] GEO Grid からAISTオープンデータへ

    • Author(s)
      小島功、的野晃整、小川宏高、中村良介、中村章人
    • Organizer
      科学情報研究会・WDS国内シンポジウム合同研究会
    • Place of Presentation
      東京理科大学
    • Invited
  • [Presentation] Social big data science: From transaction mining and interaction mining

    • Author(s)
      Hiroshi Ishikawa
    • Organizer
      6th Korea Japan Database Workshop(KJDB)
    • Place of Presentation
      熊本
    • Invited
  • [Presentation] AIST database federation project for radiation monitoring by Asian collaboration

    • Author(s)
      Yoshio Tanaka, Isao Kojima, Lan Kun Chung
    • Organizer
      OGC Asia Forum
    • Place of Presentation
      Mumbai
  • [Presentation] 中分解能地球観測衛星データの統合配信実験

    • Author(s)
      岩田敏彰、中村良介、小島功、関口智嗣、岩男弘毅、飯島昭博、徳武友輔、船木俊郎、横塚英世
    • Organizer
      第57回宇宙科学技術連合講演会
    • Place of Presentation
      米子
  • [Presentation] 土地被覆図校正のための風景画像データのカテゴリー推定

    • Author(s)
      岩田健司、尾崎竜史、岩男弘毅、小島功
    • Organizer
      ビジョン技術の実利用ワークショップ
    • Place of Presentation
      横浜
  • [Presentation] 土地被覆図校正のためのScience DCPにおける風景画像認識

    • Author(s)
      岩田健司、尾崎竜史、岩男弘毅、小島功
    • Organizer
      パターン認識・メディア理解研究会
    • Place of Presentation
      幕張メッセ
  • [Presentation] Radiation-LOD:放射線モニタリングデータのGeoSPARQLエンドポイント

    • Author(s)
      小島功、田中良夫、中村章人、的野晃整
    • Organizer
      セマンティックWebカンファレンス LOD Challenge 2013 (環境LOD賞受賞)
    • Place of Presentation
      慶応大学
  • [Presentation] 写真に付与されたジオタグに基づいた道草発見

    • Author(s)
      青山 賢,廣田 雅春,石川 博,横山 昌平
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)
    • Place of Presentation
      淡路
  • [Presentation] コンテキストに基づいたフォトストリームの分割を支援するジオタグ軌跡の集約的分析

    • Author(s)
      井上 貴弘,廣田 雅春,石川 博,横山 昌平
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)
    • Place of Presentation
      淡路
  • [Presentation] ゲーミフィケーションをユーザに無負担で導入するためのLocal Expert抽出手法~浜松を対象とした地域ブログサイト全量解析によるVenueの発見~

    • Author(s)
      三浦 惇貴,廣田 雅春,野澤 浩樹,横山 昌平
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)(学生プレゼンテーション賞受賞)
    • Place of Presentation
      淡路
  • [Presentation] ジオタグ付き写真を用いた土地被覆の分析と可視化

    • Author(s)
      大羽 浩隆,廣田 雅春,石川 博,横山 昌平
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)(学生プレゼンテーション賞受賞)
    • Place of Presentation
      淡路
  • [Presentation] Flickrは海岸線を描けるか?

    • Author(s)
      大森 雅己,廣田 雅春,石川 博,横山 昌平
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)(最優秀インタラクティブ賞受賞)
    • Place of Presentation
      淡路
  • [Presentation] イベントの時空間推定に基づくブログとマイクロブログの統合閲覧システムの提案

    • Author(s)
      野呂 勇太,三浦 惇貴,廣田 雅春,野澤 浩樹,横山 昌平
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)
    • Place of Presentation
      淡路
  • [Presentation] ジオタグ付き写真を用いたホットスポットの分類と関連の抽出

    • Author(s)
      白井 元浩,廣田 雅春,石川 博,横山 昌平
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)
    • Place of Presentation
      淡路
  • [Presentation] ジオタグ付き写真を用いた写真の撮影方向の推定手法

    • Author(s)
      廣田 雅春,石川 博,横山 昌平
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)
    • Place of Presentation
      淡路
  • [Presentation] データ分割と協調的マージに基づくGPU上の効率的ソートアルゴリズム

    • Author(s)
      小澤佑介,天笠俊之,北川博之
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)
    • Place of Presentation
      淡路
  • [Presentation] GPUを用いたCanopyクラスタリングの高速化

    • Author(s)
      林史尊,小澤佑介,天笠俊之,北川博之
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)
    • Place of Presentation
      淡路
  • [Presentation] マイクロブログマイニングによるイベント時の駅混雑原因の特定と状況の把握

    • Author(s)
      村山敬祐、佐伯圭介、遠藤雅樹、横山昌平、石川博
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)
    • Place of Presentation
      淡路
  • [Presentation] オープンアクセス・ジャーナルの時系列データクラスタリングによる高被引用学術文献推定方法の検討

    • Author(s)
      杉山いおり、遠藤雅樹、横山昌平、石川博
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014)
    • Place of Presentation
      淡路
  • [Presentation] Differential Outlier Detection on Uncertain Streams of the Gaussian Distribution

    • Author(s)
      Salman Ahmed Shaikh
    • Organizer
      The 5th International Workshop with Mentors on Databases, Web and Information Management for Young Researchers (iDB2013)
    • Place of Presentation
      北海道大学
  • [Presentation] An Incremental Computation Scheme over Array Database

    • Author(s)
      Jiang Li , Hideyuki Kawashima
    • Organizer
      情報処理学会研究報告データベースシステム(DBS)
    • Place of Presentation
      京都大学
  • [Remarks] Radiation-LOD: 放射線モニタリングデータのGeoSPARLエンドポイント

    • URL

      http://sfidev.geogrid.org/

  • [Remarks] Aderis-Hybrid 時間内で新鮮で正確な答えを求めるベストエフォート型の分散SPARQL

    • URL

      http://aderis.linkedopendata.net/

  • [Remarks] Landsat-8 Metadata Search

    • URL

      http://l8search.geogrid.org/GECSW/

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi