研究課題
本研究は,観測個体数や項目数が膨大であるデータを念頭に,発見的な考察を可能とする可視化手法や次元縮約手法・変数選択手法を検討・提案し,データの様相をより正確にとらえられるようにするとともに,そのための効率的な計算アルゴリズムの開発や計算環境の提供を行っていくことが目的である。この目的に対して,(1)先行研究等の分析と整理,(2)可視化手法と次元縮約手法および変数選択手法の検討のまとめ,(3)インタラクティブシステムの構築,(4)計算効率の検討,(5)計算環境の提供,を具体的な計画として研究を実施した。(1)(2)については,1,2年目と同様,学会・研究会への参加や連携研究者の協力により,シンボリックデータ解析を含む情報の縮約および可視化の情報収集を行った。また,大規模・高次元データの発見的情報表現と効率的情報縮約に関する研究会をもち,最新の研究について討議を行った。(3)では,大規模データの例として,アソシエーションルールの可視化についていくつかのシステムとインタラクティブな手順を開発した。また,多次元データのグラフ表現に「色」の要素を追加して,表現力を増す可視化手法の提案を行った。(4)では,既存の加速化手法の組み合わせにより,より高速な加速化を提案し,非計量主成分分析の計算とともに,組み合わせにより計算回数が膨大となる変数選択などへの応用を行い,数値実験により,提案した各種加速化手法が十分な成果(3~5倍の加速)を上げることを確認した。(5)については,Rの関数を整備し,多くの人が利用できる準備を行った。以上の成果は,学術雑誌に投稿するとともに,国内学会(日本計算機統計学会第26回大会,日本行動計量学会第40回大会),国内研究会(北海道大学),国際会議(COMPSTAT2012:キプロス)で発表した。
24年度が最終年度であるため、記入しない。
すべて 2013 2012 その他
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (5件)
Principal Component Analysis
巻: 特集雑誌 ページ: 129-144
Proceedings of COMPSTAT 2012
巻: Proceedings ページ: 461-471