2015 Fiscal Year Research-status Report
大規模データの発見的特徴把握のための情報縮約・クラスタリング融合手法の研究
Project/Area Number |
26330052
|
Research Institution | Okayama University of Science |
Principal Investigator |
森 裕一 岡山理科大学, 総合情報学部, 教授 (80230085)
|
Co-Investigator(Kenkyū-buntansha) |
飯塚 誠也 岡山大学, 学内共同利用施設等, 教授 (60322236)
黒田 正博 岡山理科大学, 総合情報学部, 教授 (90279042)
水谷 直樹 岡山理科大学, 総合情報学部, 准教授 (30330533)
久保田 貴文 多摩大学, 経営情報学部, 准教授 (30379705)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 多変量解析 / 次元縮約 / 非計量主成分分析 / 非計量因子分析 / クラスター分析 / 加速化アルゴリズム / 対話的可視化ツール |
Outline of Annual Research Achievements |
大規模データを対象とした情報縮約とクラスタリングの融合手法の開発を行うことを目的とし,本年度は,(1)次元縮約手法とクラスタリングの研究に関する動向の整理と情報交換,(2)尺度混在データの情報縮約の整理と提案,(2)融合手法の新たな融合手法への接近と発見的・試行錯誤的対話性をもったシステムの構築,(4)計算効率の検討を行った。 (1)では,昨年度に引き続き,国内では,日本行動計量学会,統計関連学会連合大会,日本計算機統計学会の大会,海外では,国際分類学会(IFCS2015)や国際計算機統計学会アジア地区会合(ARS-IASC2015)などに参加し,関連するセッションに出席するとともに同じテーマで研究を行っている研究者との交流によって最新の動向を得た。また,上記2つの国際学会では,招待セッションを企画することができ(IFCS2015:New trends and applications of alternating least squares in data analysis,ARS-IASC2015:New trends and approaches for high-dimensional and complex situations),本研究課題に関連した積極的な討論と研究動向の把握に務めた。(2)は,非計量主成分分析と非計量因子分析における尺度混在データの分析がほぼ定式化でき,変数選択などへの応用を提案できた。この成果は,上記の各学会の大会で報告した。(3)では,(1)(2)での情報などを基に,新たな融合手法を提案するための準備に入った。ここでは,既存の手法の計算を自らの計算環境において実行し,結果の確認を行うことが主となっている。(4)については,(2)における加速化をデータサイズの大きな場合や変数選択などで計算回数が膨大となる場合について評価するとともに,リスタート法を提案して,より速い手順を検討した。また,ハード的な効率を求め,分散環境をサーバに導入した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究業績の概要」に記した番号に従い,理由を述べる。 (3)に関しては,分散システムの導入は行ったが,融合手法の理論面のパラメータの扱いなどがまだ整理できていないことから,理論的,システムな対話性についてはやや遅れていると考える。また,本研究課題申請時に計画していたタッチパネル+指ジェスチャーによる対話機能の実装は,現在タブレットPCやOSそのものでその機能が実現できるようになったので,独自開発は行わないこととした。一方,(1)(2)については,概要で述べた通り,国際会議で関連の招待セッションを設け議論できたこと,また,内外の大会で発表できたことから,予定以上の成果が得られている。(2)(4)については,定式化や計算環境の整備を終え,残された課題も明確になっていることから,これも目的は予定通りあるいは予定以上の達成度であるといえる。
|
Strategy for Future Research Activity |
次年度は,最終年度として,複雑さの分析,尺度混在データの処理,対話的・発見的環境の提供,計算環境の構築のそれぞれの完成をめざす。具体的には,「情報縮約とクラスタリングの新しい癒合手法」の提案(特に尺度混在データに対して),そこでの理論面,システム面での対話性の実現,ソフト(計算理論)・ハード両面での計算の効率化を行い,シミュレーションと実データにより各手法・手順の評価を行う。また,明らかになった研究成果は,国際会議(IMS-APRM,COMPSTAT2016,ICSA2016など)や国内会議(日本行動計量学会,統計関連学会連合大会,日本計算機統計学会など)で報告を行うとともに,Webなどでの公開を行っていく。
|
Causes of Carryover |
分散処理システム(Hadoop)の構築作業がサーバ導入時に行ったことより費用が安く済んだため。
|
Expenditure Plan for Carryover Budget |
成果発表を積極的に行うため,出張費に充てる。
|
Research Products
(4 results)