研究課題
本研究は、大規模複雑データの統計数理を、理論と方法論から総合的に研究するものである。モデルの構築と評価を担うモデリング技法の開発を目的とし、3年目に当たる平成29年度は、次の3つを研究テーマとした。(1) 高次元における最適性理論と精度保証付きモデリング(2) 高次元における非線形構造と従属構造の統計数理(3) 大規模複雑データの非正則推定論と相補的モデリング(1)について、青嶋と矢田は、高次元特有のデータ構造の膨張を理論的に調査し、高次元データ特有のクラスタリング手法を開発した。幾何学的一致性というクラスターの最適配置の概念を導入し、次元数の増加とともに識別性能が向上することを証明した。竹之内は、大規模な離散確率モデルのパラメータを効率的に推定すべく、局所性を用いた正規化項の計算を必要としない手法を提案し、一致性と効率性を示した。(2)について、青嶋と矢田は、サポートベクターマシンの高次元空間における巨大なバイアスを理論的に解明し、バイアス補正サポートベクターマシンを開発した。高次元データの非線形構造に対して、カーネルと判別性能に関係性を見い出した。蛭川と連携し、従属構造について、新たなアプローチを試みた。(3)について、青嶋と矢田は、高次元固有ベクトルのスパース推定を考え、正則化パラメータの自動決定を可能にする新しいスパース推定を考えた。松井は、経時観測される大規模複雑データを分析するためのモデリング手法を開発し、医学や植物などのデータ解析へ応用した。上記の研究テーマに沿って、論文発表と学会発表を行い、関連するシンポジウムを公立はこだて未来大学・新潟大学・筑波大学・滋賀大学で計4回開催した。大規模複雑データを扱う様々な分野の研究者から高い関心を集め、研究成果や問題提起について活発な意見交換がなされた。
2: おおむね順調に進展している
研究計画の3年目として、研究目的を達成するための理論と方法論の基礎が、ほぼ計画通りに完成しつつある。
研究計画の4年目に当たる次年度は、大規模複雑データの非正則なモデリングについて、モデル評価の理論と方法論を重点的に研究する。
すべて 2018 2017 その他
すべて 国際共同研究 (2件) 雑誌論文 (8件) (うち国際共著 1件、 査読あり 8件、 オープンアクセス 6件) 学会発表 (16件) (うち国際学会 4件、 招待講演 5件) 図書 (2件) 備考 (2件)
Australian & New Zealand Journal of Statistics
巻: 60 ページ: 4-19
10.1111/anzs.12212
Scientific Reports
巻: 8 ページ: -
10.1038/s41598-018-19284-3
American Mathematical Society, Sugaku Expositions
巻: 30 ページ: 137-158
10.1090/suga/421
Journal of Statistical Planning and Inference
巻: 191 ページ: 88-100
10.1016/j.jspi.2017.05.005
Statistical Inference for Stochastic Processes
巻: 20 ページ: 329-346
https://doi.org/10.1007/s11203-017-9155-7
The Journal of Machine Learning Research
巻: 18 ページ: 1-26
Neural Networks
巻: 95 ページ: 44-56
10.1016/j.neunet.2017.06.005
Frontiers in Plant Science
巻: 28 ページ: -
10.3389/fpls.2017.02055
http://www.math.tsukuba.ac.jp/~aoshima-lab/jp/
http://www.math.tsukuba.ac.jp/~aoshima-lab/jp/kiban_A.html