データ空間上の測地距離およびその変換に着目した統計解析
Project/Area Number |
22K03439
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 12040:Applied mathematics and statistics-related
|
Research Institution | Keio University |
Principal Investigator |
小林 景 慶應義塾大学, 理工学部(矢上), 准教授 (90465922)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | 幾何学的データ解析 / データ解析 / 機械学習 / 曲率 / 多様体学習 / 理論統計学 / 幾何学的統計学 |
Outline of Research at the Start |
本研究は,データがその上に分布している空間である「データ空間」や,データ分布がその上の1点に対応するような「統計モデル空間」のそれぞれについて,その測地距離空間(2点間の最短経路により距離が定義されている空間)としての性質に着目し,新しいデータ解析手法の開発と理論構築を目指す.機械学習等のより複雑な統計モデルは,データを単にベクトルとして扱うこれまでのモデルを直接当てはめることができないため,測地距離空間の性質を活かした解析を用いることにより,データ解析の精度向上が期待される.
|
Outline of Annual Research Achievements |
本年度は,本研究により提案された距離変換に基づくデータ空間の測地距離およびextrinsicな非測地距離の理論研究とデータ解析への応用手法に関する結果を,国際会議のAlgebraic Statistics 2022において基調講演として発表した.本研究の内容は計量錐に埋め込まれたデータ空間のextrinsic距離を用いたデータ解析手法であり,その新規性と重要性は基調講演の際も高い評価を受けた.また,ロンドン・スクール・オブ・エコノミクスのHenry P. Wynn教授を長期訪問し,データ空間の曲率と測地線に着目した幾何学的データ解析に関するいくつかのトピックに関して集中的に研究討論を行い,距離変換に関する新しい理論結果を得るとともに,曲率近似計算手法を開発した.また,服部航大(慶應義塾)との共同研究として,多様体学習による局所的な距離保存精度の可視化手法および,精度劣化部分の原因の説明のためのアルゴリズムを国内学会で発表した.多様体学習は生物実験データ等の可視化として広く用いられ20年ほどの歴史を持つが,その距離近似精度についてはデータ多様体の推定手法が進んだ今日となって,初めて可能となった.これらの研究と並行して,ロバストな確率分布間ダイバージェンスであるγダイバージェンスを修正したうえで,それを用いて新しいロバストなベイズ推定量を提案する共同研究を山下亮(慶應義塾)とともに進めた.パラメータγを固定せずデータに基づき変動させる手法は新しく,その成果を国内学会で発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,3年研究計画の初年度として研究環境やネットワークの構築を中心とする研究の立ち上げを行った.具体的には,London School of EconomicsのWynn教授を長期訪問し,幾何学的データ解析,特に曲率と測地線に関する理論的な妥当性の評価と,新しい近似計算手法の開発について討論を重ね,革新的なアイデアを得るに至った.また,イギリス滞在時には,同じくイギリス訪問中であった言語の数理モデルの専門家である田中久美子教授(東大)と研究討論を行い,言語モデルの計量に関する共同研究を始めることができた.さらに,幾何学的なデータ解析の主要な研究分野である多様体学習の諸手法について,その理論的評価をGaussian PreocessやVariation AutoEncoderなどを用いて行い,それを可視化する新手法を共同研究で提案することができた.また,データ空間の幾何学のみでなく,モデル空間の幾何学に関してもロバストなダイバージェンスを用いた新しいベイズ解析手法を提案した.以上のことを踏まえて,本研究はおおむね順調に進展しているといえる.
|
Strategy for Future Research Activity |
初年度では,研究の立ち上げを行うことができたので,今後はその内容を発展させていく.具体的にはWynn教授とのデータ空間の曲率と測地線に関する共同研究をさらに進めて,新しく得られた理論結果と計算手法に関する論文を執筆する.また,新しい曲率近似手法については開発したソフトウェアを公開するための準備を進める.一方,機械学習については,この一年で拡散モデルによる画像生成やChatGPTのような生成モデルが急速に実用段階に入った.世間一般のユーザーが機械学習をはじめデータ解析に注目するようになったのと同時に,AI技術に要求するスキルのレベルが上がったことから,幾何学的なデータ解析に関する研究も,その必要性と重要性に関して再考する予定である.
|
Report
(1 results)
Research Products
(7 results)