2019 Fiscal Year Research-status Report
データに潜在する曲率情報に着目した統計解析手法の開発
Project/Area Number |
19K03642
|
Research Institution | Keio University |
Principal Investigator |
小林 景 慶應義塾大学, 理工学部(矢上), 准教授 (90465922)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | クラスタリング / 機械学習 / 多様体学習 / 曲率 |
Outline of Annual Research Achievements |
研究初年度である本年度は,新しいプロジェクトの立ち上げのための研究環境の整備および研究ネットワークの構築を行いつつ,研究により得られた成果の国際会議での発表および学術誌における論文出版を行った.具体的には,まず曲率CAT(k)に着目した距離変換と統計解析手法とその理論についての論文を,統計学および計算機理論の一流学術誌であるStatistics and Computingに出版し,国際会議(32nd European Meeting of Statisticians) において発表した.さらに,超球面上のデータに関する幾何学的なアイデアに基づき,相関係数行列を正定値行列のまま疎行列化するための新手法を提案し,その妥当性の理論的な評価を行った.その結果は統計関連学会連合大会において発表した.一方,データ空間や潜在変数の空間の幾何学を用いた統計理論を,深層学習や自然言語処理の手法に応用した新しい研究を開始し,複数の進展がみられた.そのうちのいくつかについて得られた結果を共著のarXivプレプリント2篇としてまとめ,一部は査読付き国際会議(SafeAI, AAAI-19 Workshop)において発表した.さらに,共同研究者であるHenry Wynn(London School of Economics教授)のもとを訪問し,特に「グラフのリッチ曲率を用いたデータ解析」,「周期的構造をもつデータの幾何学的な特徴量抽出」という2つの研究テーマについて研究討論を行い,今後の研究方針を確定することが出来た.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は,当初は(A)グラフのリッチ曲率を用いたデータ解析,(B) 周期的構造をもつデータの幾何学的な特徴量抽出,(C) 曲率CAT(k)に着目した距離変換と統計解析手法,という3つのテーマから研究を進める計画であった.このうち(C)については既に,得られた結果を国際雑誌において出版し,国際会議で発表を行うなど具体的な学術業績が出つつある状況である.一方,(A),(B)については,理論研究に関するディスカッションを共同研究者と進めつつ,データの応用範囲について調査中であり,具体的な学術業績には至っていない.その一方で,超球面上の幾何学を用いた相関行列の疎行列化に関する新手法を開発し,その妥当性の理論評価を国内会議で発表したことに加え,深層学習の一種であるVariational Autoencoder (VAE)の外れ値データや敵対的データに対する頑健性をもつ手法を,データ空間と潜在変数空間の幾何学的な性質に基づき提案し,鴨井遼との共著としてarXivにプレプリント2本を公表し,国際会議において発表を行った.このように空間の曲率や幾何学を用いたデータ解析手法に関して,プロジェクトを通してより有効性や新規性が高い研究を発見できたという大きな進展があった.以上を踏まえて,本研究はここまでおおむね順調に進捗しているといえる.
|
Strategy for Future Research Activity |
2年目以降は,まずテーマ(C) 「曲率CAT(k)に着目した距離変換と統計解析手法」に関して初年度に研究,発表した内容をより発展させ,より大規模な機械学習手法に応用することを試みることにより,研究の成果をより広範囲に普及させることをめざす.また,1年目に明確な研究業績が得られなかったテーマ(A),(B)については,共同研究のディスカッション頻度を増やすことにより,理論的なブレイクスルーを探り,実用的な適用データについて調査を進める.さらに,本研究の研究テーマに基づく理論の応用として新たな可能性が広がった大規模疎行列をはじめとして,深層学習や自然言語処理についてはより進んだ研究を続行し,国際会議や国際学術誌における発表を目指す.また,幾何学を用いたデータ解析手法に関しては,既存研究および提案研究内容の書籍化を検討しており,新しい分野としての広範囲への認知と,その理論と応用の普及を進める計画である.
|
Causes of Carryover |
本年度予定していた,海外共同研究者Henry Wynn氏の招聘が次年度延期となったっため,未使用額が生じた.初年度に行えなかった共同研究者との直接的なディスカッションや海外の研究ネットワーク構築のため,外国人招聘もしくはその代替手段のために使用する予定である.具体的には,研究討論や学会参加のための出張を行う,もしくは遠隔コミュニケーションのためのオンライン機器を購入する予定である.
|
Research Products
(6 results)