研究概要 |
本研究課題は,高次元座標をもつサンプルデータを,機械学習の道具である多様体学習を用いて,微分位相幾何特徴に変換するアルゴリズムを構築し,既存の解析・可視化手法の再定式化・統一化を図ることを目的としている. 本研究課題は,A.微分位相幾何特徴の種類によらない基本アルゴリズムの構築,B.個々の特徴を定義するサンプル点間の距離の定式化,C.データ処理,の3つの作業項目によって構成される.本年度はこれを,contour treeと呼ばれる,高次元データを定義する関数の値域に関する微分位相特徴に関して定式化を進めた.具体的な作業は,以下作業項目ごとに記述する. A.基本アルゴリズム:本項目においては,サンプル点分布の近接関係を表すグラフ構築,与えられた距離の定義に基づくサンプル点間の近接度や最短経路と計算,サンプル点間の相対距離関係に基づく多次元尺度構成法による次元圧縮の3つの手順の実装を行った.これにより,異なる微分位相特徴に関しても,本研究課題で実装したソフトウェア資源を利用できることとなり,今後の計算拡張性などの検討など,次年度以降の取り組みの下地を構築することにも成功した. B.距離の定式化:距離の定式化については,本年度は,値域に関する特徴を抽出するための距離の定式化を進め,プログラム実装により定義の微調整と検証までを行った.また,抽出した微分位相特徴を可視化することにより,距離の定義が与える特徴形跡への影響を,定性的な指標に加えある程度定量的に理解することにも成功した. C.データ処理:サンプル点分布の密度や均一度が,特徴解析に与える影響を調べた.具体的には,時系列データまでの4次元のデータに関しては,座標軸に沿った格子状(グリッド)サンプルデータを用いて,それ以上の次元では,今回は値域に関してある程度一様な分布をもつサンプル点を利用することで,提案する手法の健全性を検証した.
|