2014 Fiscal Year Annual Research Report
Project Area | Initiative for High-Dimensional Data-Driven Science through Deepening of Sparse Modeling |
Project/Area Number |
25120014
|
Research Institution | Keio University |
Principal Investigator |
藤代 一成 慶應義塾大学, 理工学部, 教授 (00181347)
|
Co-Investigator(Kenkyū-buntansha) |
渡辺 一帆 豊橋技術科学大学, 工学(系)研究科(研究院), 講師 (10506744)
高橋 成雄 東京大学, 情報理工学(系)研究科, 准教授 (40292619)
|
Project Period (FY) |
2013-06-28 – 2018-03-31
|
Keywords | 疎性モデリング / 機械学習 / 可視化 / トポロジー |
Outline of Annual Research Achievements |
2年目となる本年度は,初年度に選択した視覚メタファである平行座標系を用いたスパースモデリング向け基本可視化基盤のプロトタイプを,新たな商写像変換原理としてバイクラスタリングを導入することで,高次元データの特徴的な部分空間を視覚探索する処理の枠組みに洗練化した.高い相関をもつ次元とデータサンプルを同時にクラスタリングするために,基本的なバイクラスタリングアルゴリズムに球面k-means法を組み合わせ,非対称バイクラスタリング手法を提案した.その際,次元削減法を用いて相関の高い次元のデータサンプルを単一の合成軸へ射影することで,相関の高い次元を自動的に部分空間へグルーピングする.相関の高い次元とデータサンプルは特定の色を割り当てて表示,あるいはブロック行列として表現することで,データの商写像表現を視覚的にわかりやすい画像情報として可視化する.それに対して,部分空間の視覚探索とともに相関の小さい部分空間を段階的に取り除く対話的処理により,低次元データ表現を効果的に導くことができ,それらはさらに視覚的乱雑さを低減した既知のedge bundlingやstrip rendering等の拡張平行座標系表示,他で効果的に可視化される. 加えて,前年度に引き続き,本研究の基軸とする三課題,すなわち【課題1】最適商写像選択過程の機械学習,【課題2】商写像表現変換のための潜在変数モデリング,【課題3】次元圧縮写像の視覚メタファとグリフ設計にそって,各種の支援技術も継続的に開発している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当年度に開発したバイクラスタリングによる平行座標系表示は,スパースモデリング向けの可視化基盤のプロトタイプとして,昨年度の軸縮約並行座標系以上の成果をおさめたと考えられる.実際,領域内の実験・計測班のなかでも天文学班が特に興味を示し,ブレーザや超新星の観測データに対する適用実験を通して,天文学における従来の経験的アプローチに匹敵する天体の半自動分類の効果を具体的に検証している.以上の成果の一部は,可視化全般の有力国際会議として知られるIEEE PacificVis2015に採択されている.このように,領域内の分野横断型可視化の連携も着実に成果を上げ始めている.
|
Strategy for Future Research Activity |
次年度からは,本計画研究発足時から挑んできた三課題,すなわち【課題1】最適商写像選択過程の機械学習,【課題2】商写像表現変換のための潜在変数モデリング,【課題3】次元圧縮写像の視覚メタファとグリフ設計の各組合せから導出される対合による複合課題A~Cを以下のように設定し,さらに研究を推進する. 【複合課題A(課題1と2の対合)】商写像推定の高可用性:商写像変換の推定に用いられる学習モデルの複雑度自体をデータから推定する枠組みを構築し,商写像推定の可用性を高めるような拡張を行う. 【複合課題B(課題2と3の対合)】視覚メタファ設計:視覚メタファを適切に設計することで,次元圧縮などに対応するデータの商写像表現の視認性を向上させる.特に,高次元から中次元データの視認性向上につながる商写像変換の構築を,データ解析の用途に応じて様々な可視化技法と連動させて検討していく. 【複合課題C(課題3と1の対合)】履歴学習:可視化の出自管理に注目し,本計画研究で開発してきた種々の多次元可視化技法群の利用履歴を機械学習し,新たに与えられるデータに対して,最適な技法とその利用シナリオを推奨できるような可視化設計支援機能を実現する.
|
Research Products
(14 results)