研究課題/領域番号 |
23K28045
|
補助金の研究課題番号 |
23H03355 (2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2023) |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
小区分61030:知能情報学関連
合同審査対象区分:小区分60030:統計科学関連、小区分61030:知能情報学関連
|
研究機関 | 京都大学 |
研究代表者 |
下平 英寿 京都大学, 情報学研究科, 教授 (00290867)
|
研究分担者 |
寺田 吉壱 大阪大学, 大学院基礎工学研究科, 准教授 (10738793)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
18,460千円 (直接経費: 14,200千円、間接経費: 4,260千円)
2025年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円)
2024年度: 9,620千円 (直接経費: 7,400千円、間接経費: 2,220千円)
2023年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
|
キーワード | 多変量解析 / パターン認識 / 次元削減 / 分散表現 / 表現学習 / ベイズ統計学 / 事前分布 / 仮説検定 / MCMC法 / サンプリング / 頻度論 |
研究開始時の研究の概要 |
ベイズ統計学ではデータ尤度と事前分布からベイズ推論を行うことで,対象に関する情報を無駄なく活かすことができる.しかし,仮説検定の課題においては必ずしもベイズ推論は有効に機能せず,従来から頻度論的推論が標準的に利用されている.本研究では,事前分布を頻度論的推論に矛盾なく取り込むための原理と実装の創出を目指す.通常は捨てている事前分布を頻度論的推論に活かすことで,柔軟なモデリングや恵まれた計算環境といったベイズ推論の良さも頻度論的推論へ引き継がれる.
|
研究実績の概要 |
近年のベイズ統計学の普及はめざましい.パラメータ事前分布とデータ尤度からなる生成モデルにベイズの定理を適用してパラメータ事後分布を計算することは概念的に明快でMCMC法が普及したことでベイズ推論の利用が拡大した.しかし仮説検定の課題においては必ずしもベイズ推論は有効に機能せず,従来から頻度論的推論が標準的に利用されている状況は変わっていない.本研究では,事前分布を頻度論的推論に矛盾なく取り込むための原理と実装の創出を目指す.ベイズ統計学で得られる事後分布をそのまま利用して確率のスケーリング則の理論を適用すると,ベイズ推論の事後確率と信用区間は頻度論的推論のp値と信頼区間に変換される.通常は捨てている事前分布を頻度論的推論に活かすことで,柔軟なモデリングや恵まれた計算環境といったベイズ推論の良さも頻度論的推論へ引き継がれる.
具体的な研究課題として3項目を計画した.(1)パラメータ事前分布を頻度論的推論に活用する原理を与え,(2)事後分布からのサンプリングを利用して頻度論的推論を実装し,(3)ニューラルネットなど大規模モデルでも有効性を検証する.このうち,本年度の概要は次の通り. ・研究項目(1)と(2)について,簡単な確率モデルを用いて検討する. 多変量正規分布の設定において,有効性を確認している. ・研究項目(3)について,ニューラルネットの現実的な規模のモデルで基礎的な性質を確認する.具体的には,単語の分散表現(単語ベクトル)の学習において,ランジュバン動力学にもとづくMCMCを実装した.その結果,これがベイズの事後分布からのサンプリングの近似として有効であるが,一方でMCMCの収束性について十分に検討すべきであることがわかった.また,静的な単語ベクトルだけでなく,言語モデルに見られる動的な埋め込み等の様々な状況で学習の実験を行い,表現学習における埋め込みの性質を調べた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
理論研究とその実証実験,および自然言語処理等への応用で一定の成果があった.
|
今後の研究の推進方策 |
今後も自然言語処理などの応用をすすめて得られる知見を理論研究に生かしつつ,理論的な興味に基づいた研究も発展させる.
|