2018 Fiscal Year Annual Research Report
Thery and methods for high dimensional data analysis with internal structure
Project/Area Number |
26280009
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
福水 健次 統計数理研究所, 数理・推論研究系, 教授 (60311362)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 大慈 東京大学, 大学院情報理工学系研究科, 准教授 (60551372)
小林 景 慶應義塾大学, 理工学部(矢上), 准教授 (90465922)
|
Project Period (FY) |
2014-04-01 – 2019-03-31
|
Keywords | 統計数学 / データ解析 / 高次元 / アルゴリズム |
Outline of Annual Research Achievements |
H30年度は、以下の項目に関して研究を遂行した。 (1) カーネル法の実問題に有用なモデルとして、ガウス過程ポワソン回帰を用いた集計データ解析のための効率的計算アルゴリズムを研究した。比較的広域で集計されたデータと、より解像度の高いサテライトデータなどの共変量とを合わせて、集計データが採取されたのよりも小さい地域での計数データの推定を行う問題に対し、100万地域などの大規模なケースでも推定可能な効率的アルゴリズムを開発した。ある国のマラリア患者数データと衛星データによる18種の共変量に応用し、100万個以上の小さな領域での患者数が推定可能なことを示した。 (2) カーネル法を用いた分布間の距離尺度Maximum Mean Discrepancy(MMD)の、ランダムサンプリングによる不完全U統計量を用いた線形的効率計算と、その事後選択推論(Post Selection Inference)としての特徴選択による分布の均一性検定への応用に関する研究を継続し、その方法をデータの生成モデルの比較に応用した結果をまとめた論文が、トップ国際会議 Intern. Conf. Learning Representation に採択された。(2019年5月発表) (3) データが存在する空間として、平たんではない曲がった空間を表すCAT(k)空間を想定し、その距離を用いた距離行列に基づくデータ解析法を開発した。これにより、データ分布の異なるクラスタ構造などを抽出することが可能となった。この結果をまとめた論文が、一流国際誌 Statistics and Computingで出版された。
|
Research Progress Status |
平成30年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
平成30年度が最終年度であるため、記入しない。
|
Causes of Carryover |
平成30年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
平成30年度が最終年度であるため、記入しない。
|
Research Products
(22 results)