Project/Area Number |
20H00576
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 60:Information science, computer engineering, and related fields
|
Research Institution | University of Tsukuba |
Principal Investigator |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
|
Co-Investigator(Kenkyū-buntansha) |
矢田 和善 筑波大学, 数理物質系, 教授 (90585803)
星野 伸明 金沢大学, 経済学経営学系, 教授 (00313627)
塩濱 敬之 南山大学, 理工学部, 教授 (40361844)
鈴木 大慈 東京大学, 大学院情報理工学系研究科, 准教授 (60551372)
石井 晶 東京理科大学, 創域理工学部情報計算科学科, 講師 (20801161)
江頭 健斗 東京理科大学, 創域理工学部情報計算科学科, 助教 (20979869)
荒木 由布子 東北大学, 情報科学研究科, 教授 (80403913)
川野 秀一 九州大学, 数理学研究院, 教授 (50611448)
蛭川 潤一 新潟大学, 自然科学系, 准教授 (10386617)
松田 安昌 東北大学, 経済学研究科, 教授 (10301590)
田畑 耕治 東京理科大学, 理工学部情報科学科, 教授 (30453814)
片山 翔太 慶應義塾大学, 経済学部(三田), 准教授 (50742459)
中山 優吾 京都大学, 情報学研究科, 助教 (40884169)
植木 優夫 長崎大学, 情報データ科学部, 教授 (10515860)
小森 理 成蹊大学, 理工学部, 准教授 (60586379)
金森 敬文 東京工業大学, 情報理工学院, 教授 (60334546)
松井 秀俊 滋賀大学, データサイエンス学部, 准教授 (90633305)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥44,460,000 (Direct Cost: ¥34,200,000、Indirect Cost: ¥10,260,000)
Fiscal Year 2024: ¥9,490,000 (Direct Cost: ¥7,300,000、Indirect Cost: ¥2,190,000)
Fiscal Year 2023: ¥9,360,000 (Direct Cost: ¥7,200,000、Indirect Cost: ¥2,160,000)
Fiscal Year 2022: ¥7,410,000 (Direct Cost: ¥5,700,000、Indirect Cost: ¥1,710,000)
Fiscal Year 2021: ¥8,190,000 (Direct Cost: ¥6,300,000、Indirect Cost: ¥1,890,000)
Fiscal Year 2020: ¥10,010,000 (Direct Cost: ¥7,700,000、Indirect Cost: ¥2,310,000)
|
Keywords | 高次元データ / 時空間データ / 高次元統計解析 / 深層学習 / 高次元小標本 |
Outline of Research at the Start |
本研究は、益々巨大化かつ複雑化する多様な大規模複雑データに、統一的な理論を開拓し、高速で頑健かつ高精度な方法論を開発することで、最先端データ科学に革新的な展開を図る。高次元統計解析を基軸とし、機械学習、深層学習、時空間統計、生物統計、公的統計を世界的レベルでリードしてきた研究者達が本研究課題のもと一堂に会し、連携・融合・発展することで、科学技術・社会・経済・産業の要請に多大な貢献をもたらすことを目指す。
|
Outline of Annual Research Achievements |
青嶋と矢田は、自動正則化主成分分析法とデータ変換法を考案し、高次元ノイズの高精度な除去を可能にした。高次元非階層型クラスタリングが一致性をもつ条件を示した。 自動正則化主成分分析法を使いデータの非スパース構造を解析して汚染と正常を精密に識別し、データ変換法を使い汚染データの正常化に成功した。 青嶋と矢田と石井は、深層学習の中間層に潜む非スパースな構造に汎化誤差の精密な評価をした。川野は、マルチタスク学習モデルにおいて、凸クラスタリングをモデリングの過程に組み込み、推定精度および予測精度を改善した。ベイズスパースモデルについて、連結lassoを馬蹄事前分布の枠組みに拡張した。蛭川は、独立性の帰無仮説に対して、定常ARMA対立仮説を検定する問題を局所定常過程に一般化し、ランク検定統計量を応用した。Le Camのcontiguityの概念とLe Cam’s third lemmaを応用し、帰無仮説と対立仮説の両方で検定統計量の漸近正規性を導いた。鈴木は、高次元データにおけるニューラルネットワークの学習に最適化と予測誤差の解析を行った。平均場ニューラルネットワークの学習について、収束解析と次元に対するサンプル複雑度を導出し、カーネル法に優越することを理論的に示した。データの非等方性が計算量と統計的予測誤差の両方を改善し、カーネル法よりも強く恩恵を受けることを示した。深層基盤モデルに関して近似誤差と汎化誤差を解析し、拡散モデルとTransformerが次元の呪いを回避する機構を備えていることを示した。荒木は、長期大規模コホート研究における高精度な生存時間推定法の開発に取り組み、時間依存共変量がある場合に生存関数推定のバイアスを除くモデルを検討した。 得られた研究成果は国内外の学会や学術誌で発表し、さらに、研究テーマに沿ったシンポジウムを筑波大学・新潟大学・九州大学・東北大学で開催した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画の4年目として、多様な大規模複雑データを解析するための理論と方法論が、盤石に構築されてきた。特に、 (2)汚染データに頑健な非スパースモデリングの構築 (4)高次元統計解析による深層学習の解明 (5)大規模時空間データへの非スパースモデリングの拡張 については躍進的な成果が得られ、おおむね順調に進展していると評価できる。
|
Strategy for Future Research Activity |
研究課題の最終年度では、研究目的に掲げた5点について、理論と方法論の研究成果を盤石なものにする。また、研究課題について総括的な国際シンポジウムを開催し、科学技術・社会・経済・産業の要請に多大な貢献をもたらすことを目指す。
|