2018 年度実施状況報告書

不均一データストリームに対応した深層学習

研究課題

研究課題/領域番号	17K00310
研究機関	公立はこだて未来大学
研究代表者	新美礼彦公立はこだて未来大学, システム情報科学部, 准教授 (80347179)
研究期間 (年度)	2017-04-01 – 2020-03-31
キーワード	データマイニング / 深層学習 / 不均一データ / 機械学習
研究実績の概要	本研究は平成29年度から3年の計画であり，2年目は，主として(2) ストリーム性を考慮したマイニングアルゴリズムの開発を行った。これまで提案者が開発してきたアルゴリズムでの知見を元に、前年度に構築した，不均一分布を持ったデータに対する分散処理可能な深層学習(Deep Learning)のためのアルゴリズムをストリームデータに対応させるアルゴリズムの検討を行った。不均一分布を持ったデータをサンプリングとデータ生成により、精度を向上させる手法を提案し，ベンチマーク用データセットに適用し、提案手法の有効性を検証した。ストリームデータとしてネットワークパケットを元にした不正侵入検知を取り上げ，検知手法を検討した。また、自然言語処理を対象にしたトピックモデルによる話題推定手法の多義語と新語への対応、ソースコード特有の近傍単語の影響を考慮したword2vecを用いた類似コード片推薦手法を提案した。 2年目の研究成果をまとめて，1つの雑誌論文(JITST)と5つの国際会議(IEA-AIE 2018, FSDM2018, SCIS&ISIS with ISWS2018, WorldCIS-2018, IMCIC 2019)にて発表を行った。国内研究会でも発表を行った. 本研究を受けて，日本知能情報ファジィ学会の論文誌の特集を企画した.
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由計画2年目に予定していた、ストリーム性を考慮したマイニングアルゴリズムに取りかかることができ，初年度に開発した手法の検証実験とストリームデータを用いた検証実験をを行うことができた．研究結果に関しては，国際会議にて発表できた．また、本研究を受けて，日本知能情報ファジィ学会の論文誌の特集を企画した.
今後の研究の推進方策	今後は，提案した不均一分を持ったデータに対する深層学習アルゴリズム，ストリーム性を考慮したデータマイニングアルゴリズムを実際の大規模並列分散環境上に構築し、大規模実データを用いて、性能評価を行う。性能評価では、高速化、精度、データの増加に対するスケール、の観点から構築アルゴリズムの評価を行う。これにより、動的な構造の変化や時間的変化、外れ値の影響を抑えた上で、大規模データセットを用いた際の分析効率の改善を目指す。前年までに構築したアルゴリズムに対し、パラメータチューニングの自動化を組み込む。パラメータチューニングは、多くのパラメータセットを並列分散処理することにより、最適なパラメータセットを探す。前年までの研究成果により、アルゴリズムが高速化されているため、実時間でのパラメータチューニングが可能となる。また、アルゴリズムの一般化を考えることにより、メタ学習モデルを構築する。メタ学習モデルを組み込んだシステムを構築する事により、大規模データに対し、知識発見システム構築のための試行錯誤を高速に行うことが可能となる。これにより、大規模不均一データストリームに対応した新しい手法を提案する。
次年度使用額が生じた理由	AWS利用料が実験時間に比例するため，使用計画での金額と実際の支出額に差が生じた．生じた差額は次年度以降のAWS利用料に使用する予定である。

研究成果
(8件)

すべて 2019 2018

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (7件) (うち国際学会 5件)

[雑誌論文] Majority Rule Approach to Deep Learning for Large Benchmark Data and Real Credit Card Transaction Data2018
- 著者名/発表者名
  Ayahiko Niimi
- 雑誌名
  
  Journal of Internet Technology and Secured Transaction (JITST)
  
  巻: 6 ページ: 541-547
- DOI
  10.20533/jitst.2046.3723.2018.0067
- 査読あり / オープンアクセス
[学会発表] Data Anonymization and Sampling Algorithms Using Imbalanced Datasets for Deep Learning2019
- 著者名/発表者名
  Ayahiko Niimi
- 学会等名
  Proceedings of the 10th International Multi-Conference on Complexity, Informatics and Cybernetics: IMCIC 2019
- 国際学会
[学会発表] Study on Data Anonymization for Deep Learning2018
- 著者名/発表者名
  Ayahiko Niimi
- 学会等名
  The 31st International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA-AIE 2018)
- 国際学会
[学会発表] Word Topic Prediction Model Using a Topic Model2018
- 著者名/発表者名
  Ayahiko Niimi
- 学会等名
  The 4th International Conference on Fuzzy Systems and Data Mining (FSDM2018)
- 国際学会
[学会発表] Similar Code Fragment Recommendation Using Word2Vec2018
- 著者名/発表者名
  Takeru Uchiyama and Ayahiko Niimi
- 学会等名
  SCIS&ISIS with ISWS2018
- 国際学会
[学会発表] Data Anonymization Using Imbalanced Data for Deep Learning2018
- 著者名/発表者名
  Ayahiko Niimi
- 学会等名
  World Congress on Internet Security (WorldCIS-2018)
- 国際学会
[学会発表] オートエンコーダを使用したサンプリング手法による不均衡データの再現度向上2018
- 著者名/発表者名
  阪本宏輔, 新美礼彦
- 学会等名
  研究報告情報基礎とアクセス技術（IFAT）
[学会発表] 相関関係の変化を利用した内部ネットワークの異常検知手法2018
- 著者名/発表者名
  高畑孝輝 , 新美礼彦
- 学会等名
  研究報告情報基礎とアクセス技術（IFAT）

2018 年度 実施状況報告書

不均一データストリームに対応した深層学習

研究代表者

新美 礼彦 公立はこだて未来大学, システム情報科学部, 准教授 (80347179)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Majority Rule Approach to Deep Learning for Large Benchmark Data and Real Credit Card Transaction Data2018

著者名/発表者名

雑誌名

DOI

[学会発表] Data Anonymization and Sampling Algorithms Using Imbalanced Datasets for Deep Learning2019

著者名/発表者名

学会等名

[学会発表] Study on Data Anonymization for Deep Learning2018

著者名/発表者名

学会等名

[学会発表] Word Topic Prediction Model Using a Topic Model2018

著者名/発表者名

学会等名

[学会発表] Similar Code Fragment Recommendation Using Word2Vec2018

著者名/発表者名

学会等名

[学会発表] Data Anonymization Using Imbalanced Data for Deep Learning2018

著者名/発表者名

学会等名

[学会発表] オートエンコーダを使用したサンプリング手法による不均衡データの再現度向上2018

著者名/発表者名

学会等名

[学会発表] 相関関係の変化を利用した内部ネットワークの異常検知手法2018

著者名/発表者名

学会等名

2018 年度実施状況報告書

新美礼彦公立はこだて未来大学, システム情報科学部, 准教授 (80347179)