• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

モデルマイニング:超高次元大規模データからの局所モデル探索列挙手法の探求

Research Project

Project/Area Number 26540116
Research InstitutionOsaka University

Principal Investigator

鷲尾 隆  大阪大学, 産業科学研究所, 教授 (00192815)

Project Period (FY) 2014-04-01 – 2016-03-31
Keywordsデータマイニング / 列挙探索 / 機械学習 / モデリング / 超高次元データ / 大規模データ
Outline of Annual Research Achievements

本研究では、数千次元を超える超高次元大規模データから各サブプロセスを表す変数と事例、モデルの候補組を高速探索列挙するモデルマイニング原理を探求、さらに生化学・医療、経済への実験適用を通じアルゴリズムを検討することを目的としている。
平成26年度は、(1)データから蓋然性の高い3項組(変数部分集合,事例部分集合,モデル)を見出す統計的・情報論的基準の構築、(2)データからの基準を満たす3項組候補の高速探索列挙原理の構築に加え、一部(3)実ビッグデータに基づく効率的アルゴリズムの検討に取り組んだ。
(1)では、膨大な次元を有しかつ膨大な事例から成る大規模データについて、そのデータのすべてにアクセスすることなく、データの複雑な分布を効率的に推定する原理に関する追及を行った。
(2)については、(1)と並行して特にデータから関連する事例と変数を選択してモデル関係を探索する原理について探求を行った。
(3)については、これら(1)及び(2)の原理を計算機に実装するアルゴリズムの予備的検討を行い、これらの考え方を一部取り入れた大規模データからのモデリング手法を検討し、プロセスプラントのモデリング、及びテキストデータのクラスタリングで応用適用し、その潜在的有効性を確認した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究実績の概要で述べたように、平成26年度は(1)データから蓋然性の高い3項組(変数部分集合,事例部分集合,モデル)を見出す統計的・情報論的基準の構築、(2)データからの基準を満たす3項組候補の高速探索列挙原理の構築に加え、一部(3)実ビッグデータに基づく効率的アルゴリズムの検討に取り組んだ。
(1)について、膨大な次元を有しかつ膨大な事例から成る大規模データについて、そのデータのすべてにアクセスすることなく、データの複雑な分布を効率的に推定する基礎原理の見通しを得ることができ、所定の目標に沿う研究進捗を達成した。
(2)についても、データから関連する事例と変数を選択してモデル関係を探索する基礎原理の見通しを得ることができ、所定の目標に沿う研究進捗を達成した。
(3)についても、以上の原理を計算機に実装するアルゴリズムの予備的検討を行い、これらの一部取り入れた大規模データからのモデリング手法を検討し、プロセスプラントのモデリング、及びテキストデータのクラスタリングで応用適用し、その潜在的有効性を確認した。
以上の状況から、概ね予定通りの研究進捗を達成していると言える。

Strategy for Future Research Activity

平成26年度の(1)データから蓋然性の高い3項組(変数部分集合,事例部分集合,モデル)を見出す統計的・情報論的基準の構築、(2)データからの基準を満たす3項組候補の高速探索列挙原理の構築の成果を受け、(3)実ビッグデータに基づく効率的アルゴリズムの検討と(4) 原理・アルゴリズムの実例題検証に本格的に取り組む。また、(3)、(4)の検証結果を受け(1)、(2)に戻り基準や原理に反映修正を行う予定である。
実施項目3)、(4)では、実データの性質を踏まえた各種アルゴリズムを検討する。特に観測対象系におけるサブシステム間の結合の疎密度合いが探索列挙の高速性に大きな影響を与えると予想される。そこで、結合が疎および密な場合に分けたアルゴリズム検討を行う予定である。また、データの観測対象系に含まれるサブシステムに無関係な変数や外れ事例の多少も結果に影響を与えるので、それぞれに対応可能なアルゴリズムの検討と検証を行い、必要に応じて(1)、(2)にフィードバックする。これを繰り返して、潜在的実用性の高いモデルマイニング手法を確立する。

Causes of Carryover

本研究では、当初から研究代表者の研究室に具備されている共用計算機サーバ、その上の統計計算用ソフト及び一般のプログラム言語によるプログラムを生かす予定であった。用ただし、他用途と共用であるため、他研究の進捗によって計算機資源が不足する可能性があった。また、生化学・医療や経済・マーケティング実データについては、セキュリティ管理上他とは切り離した保管、計算が望ましく、専用の計算サーバを準備する予定であった。
しかし、他研究の進捗により、今年度については既存の計算機及びソフトウエアを十分に使用できたこと、さらに生化学・医療や経済・マーケティング実データの入手が次年度に持越しになったことで、専用のデータ保管及び計算用のサーバの準備も次年度に繰り越すこととした。

Expenditure Plan for Carryover Budget

次年度は、他に大型の研究プロジェクトを実施するため、既存の研究室の計算機及びソフトウエア資源を利用できない。また、生化学・医療や経済・マーケティング実データが入手され、それらのデータ保管及び計算のための専用のサーバ計算機が必要になる。そのため、今年度繰り越した予算によって、これらの物品を購入し研究を推進する予定である。

  • Research Products

    (5 results)

All 2014

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results,  Acknowledgement Compliant: 1 results) Presentation (4 results)

  • [Journal Article] Application of Continuous and Structural ARMA Modeling for Noise Analyses of a BWR Coupled Core and Plant Instability Event2014

    • Author(s)
      Marina Demeshko, Abdel Dokhane, Takashi Washio, Hakim Ferroukhi , Yoshinobu Kawahara, Carlos Aguirre
    • Journal Title

      Annals of Nuclear Energy

      Volume: 75 Pages: 645-657

    • DOI

      10.1016/j.anucene.2014.08.045

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] mp-dissimilarity: A data dependent dissimilarity measure2014

    • Author(s)
      Sunil Aryal, Kai Ming Ting, Gholamreza Haffari, and Takashi Washio
    • Organizer
      ICDM2014:IEEE International Conference on Data Mining
    • Place of Presentation
      深せん(中国)
    • Year and Date
      2014-12-17
  • [Presentation] Improving iForest with relative mass2014

    • Author(s)
      Sunil Aryal, Kai Ming Ting, Jonathan Wells, and Takashi Washio
    • Organizer
      PAKDD2014: The 18th Pacific-Asia Conference on Knowledge Discovery and Data Mining
    • Place of Presentation
      台南市(台湾)
    • Year and Date
      2014-05-14
  • [Presentation] Application of a Continuous Time Structural ARMA Modeling to Stability Analysis of a Nuclear Reactor2014

    • Author(s)
      Demeshko Marina, Washio Takashi, Kawahara Yoshinobu, and Pepyolyshev Yuriy
    • Organizer
      2014年第28回人工知能学会全国大会大会
    • Place of Presentation
      ひめぎんホール(愛媛県松山市)
    • Year and Date
      2014-05-14
  • [Presentation] A performance comparison of generative and discriminative models in causal and anticausal problems2014

    • Author(s)
      Patrick Blobaum, Shohei Shimizu, and Takashi Washio
    • Organizer
      Seventeenth International Conference on Artificial Intelligence and Statistics
    • Place of Presentation
      レイキャビック(アイスランド)
    • Year and Date
      2014-04-22

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi