Project/Area Number |
23K11016
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Tokyo University of Science |
Principal Investigator |
橋口 博樹 東京理科大学, 理学部第一部応用数学科, 教授 (50266920)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Fiscal Year 2025: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2024: ¥260,000 (Direct Cost: ¥200,000、Indirect Cost: ¥60,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 固有値分布 / 多変量解析 / ランダム行列 / ネットワーク分析 / 固有値分布論 / 多変量正規分布 / ウィシャート分布 / 多様体学習 / 特異ランダム行列 |
Outline of Research at the Start |
本研究で明らかにしたい内容は次の3つである.一番目は行列が特異の場合の固有値の正確な振る舞いの解析,つまり正確分布の導出と,漸近的な性質の解明である.二番目は,特異・非特異の場合の固有値分布の理論が統計的検定などの既存の統計学の枠組みにとらわれず,現実社会へどのように応用できるかを研究することである.特に,多様体学習における次元削減の方法論や機械学習のニューラルネットワークのモデルの精度保証について,固有値解析を通して明らかにすることが三番目の研究内容である.
|
Outline of Annual Research Achievements |
本研究で明らかにしたい内容は次の3つである.一番目は行列が特異の場合の固有値の正確な振る舞いの解析,つまり正確分布の導出と,漸近的な性質の解明である.二番目は,特異・非特異の場合の固有値分布の理論が統計的検定などの既存の統計学の枠組みにとらわれず,現実社会へどのように応用できるかを研究することである.特に,多様体学習における次元削減の方法論や機械学習のニューラルネットワークのモデルの精度保証について,固有値解析を通して明らかにすることが三番目の研究内容である. 2023年度では,最初の課題である固有値の正確な振る舞いと漸近的な性質を明らかにし,そして,2番目の課題である応用研究として,ネットワークのコミニュティ検出の研究を行なった.これらの内容は査読付き学術雑誌に掲載された.特異ウィシャート行列の固有値の正確な分布を利用し,さらにラプラス近似により個々の固有値の分布をカイ二乗分布で近似した.また,ネットワークのコミニュティ検出の研究では,確率的ブロックモデルにおいて,グラフの隣接行列も固有値分布を利用して,コミュニティを形成しているかどうかと,そのコミュニティの数(クラスター数)が妥当かを統計的に判断する方法を開発した.また,研究協力者の学生に,遺伝子データ解析にランダム行列論をどのように利用するかや,機械学習の単純なニューラルネットワークのモデルに固有値の分布をどうように応用するかの文献調査等を行い,実際に計算機実験用のプログラムも作成した.また新たに,ホワイトウィシャート行列での最大固有値と最小固有値,それらの比(条件数)の分布,二つのウィシャート分布の比の固有値を記述するための行列変量ラゲール多項式の研究にも着手し,これらの研究の一部を国内学会で発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の研究期間の3年を一年半ずつ2期に分けて研究を計画した.研究期間内に明らかにしたい内容を次の3つあげた.最初のテーマ「行列が特異の場合の固有値の正確な振る舞いの解析,つまり正確分布の導出と,漸近的な性質の解明」については,学会発表を行い,論文投稿後に採録も決まった.また,実数,複素数,四元数を統一的に扱うことのできる状況においても,学会発表を行い,論文投稿に至っている.二つ目の現実社会への応用でもネットワーク分析のあたらな方法を提案し,学会発表を行い,論文投稿後に採録に至った.さらに固有ベクトルの検定問題にも拡張できることが分かり,学会発表を行なった.三つ目のテーマである多様体学習における次元削減の方法論や機械学習のニューラルネットワークのモデルの精度保証について,固有値解析を通して明らかにすること」については,研究協力者とともに文献のサーベイ,数値実験などを行なった.次年度の研究に着実につながる土台を築いたと思われる. 1番目のテーマでは成果がでたものの,一般のパラメータに発展させた理論の構築は,予想外に難しいことが分かってきた.次年度に十分な検討を要する.一方で,2番目のテーマの現実問題への応用については,3番目のテーマの機械学習等への応用も含めて,当初想定していなった分野,シングルセルデータ解析への応用,固有ベクトルの検定問題につながることが分かり,より発展する感触も得られている.このような状況から,テーマ1については今後の進捗に不安が残るものの,現時点では3つのテーマに関して「順調に進展している」と考えられる.
|
Strategy for Future Research Activity |
1年目において,特異の実ウィシャート行列において,サンプルサイズが十分大きい場合に各固有値の分布がカイ二乗分布に分布収束することを示した.まずは,この結果を複素数,四元数の場合へと発展させ,一般のブロークンアローモデルにも拡張できるかを検討する.また,応用研究ではネットワーク分析をを行なったが,2023年度に検討した他の応用研究の内容(学習理論への応用,遺伝子データ解析,次元削減など)をまとめ,学会発表や論文執筆を行う.2023年度に購入した実験用の計算機を使って,高次元かつ多数のデータに対しての固有値の振る舞いをシミュレーションしたり,単純なニューラルネットワークモデルでの固有値の振る舞いを実験するなど,シミュレーション実験も視野にいれて研究を進める.このような多様体学習の次元削減の方法論やニューラルネットワークモデルは,行列の分解や掛け算による伝搬を行う方法論であり,固有値の振る舞いの解析は重要と考えられ,理論と数値実験的なシミュレーションを通して現象解明につなげたい.引き続き文献調査や比較的単純なモデルでのコンピュータへの実装を研究協力者とともに行い,高次元でサンプルサイズが大きい場合へと発展させるという方針で研究を進める.本年度も昨年度同様に学会発表や研究会での順次行い,論文執筆・投稿を行うようにする.また,固有ベクトルの分布についても昨年度に文献調査やシミュレーション実験をおこなったので,本年度に論文としてまとめ投稿まで行いたい.
|