事前分布を活用する頻度論的推論

研究課題

研究課題/領域番号	23K28045
補助金の研究課題番号	23H03355 (2023)
研究種目	基盤研究(B)
配分区分	基金 (2024) 補助金 (2023)
応募区分	一般
審査区分	小区分60030:統計科学関連小区分61030:知能情報学関連合同審査対象区分:小区分60030:統計科学関連、小区分61030:知能情報学関連
研究機関	京都大学
研究代表者	下平英寿京都大学, 情報学研究科, 教授 (00290867)
研究分担者	寺田吉壱大阪大学, 大学院基礎工学研究科, 准教授 (10738793)
研究期間 (年度)	2023-04-01 – 2026-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	18,460千円 (直接経費: 14,200千円、間接経費: 4,260千円) 2025年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円) 2024年度: 9,620千円 (直接経費: 7,400千円、間接経費: 2,220千円) 2023年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
キーワード	多変量解析 / パターン認識 / 次元削減 / 分散表現 / 表現学習 / ベイズ統計学 / 事前分布 / 仮説検定 / MCMC法 / サンプリング / 頻度論
研究開始時の研究の概要	ベイズ統計学ではデータ尤度と事前分布からベイズ推論を行うことで，対象に関する情報を無駄なく活かすことができる．しかし，仮説検定の課題においては必ずしもベイズ推論は有効に機能せず，従来から頻度論的推論が標準的に利用されている．本研究では，事前分布を頻度論的推論に矛盾なく取り込むための原理と実装の創出を目指す．通常は捨てている事前分布を頻度論的推論に活かすことで，柔軟なモデリングや恵まれた計算環境といったベイズ推論の良さも頻度論的推論へ引き継がれる．
研究実績の概要	近年のベイズ統計学の普及はめざましい．パラメータ事前分布とデータ尤度からなる生成モデルにベイズの定理を適用してパラメータ事後分布を計算することは概念的に明快でMCMC法が普及したことでベイズ推論の利用が拡大した．しかし仮説検定の課題においては必ずしもベイズ推論は有効に機能せず，従来から頻度論的推論が標準的に利用されている状況は変わっていない．本研究では，事前分布を頻度論的推論に矛盾なく取り込むための原理と実装の創出を目指す．ベイズ統計学で得られる事後分布をそのまま利用して確率のスケーリング則の理論を適用すると，ベイズ推論の事後確率と信用区間は頻度論的推論のp値と信頼区間に変換される．通常は捨てている事前分布を頻度論的推論に活かすことで，柔軟なモデリングや恵まれた計算環境といったベイズ推論の良さも頻度論的推論へ引き継がれる．具体的な研究課題として３項目を計画した．（１）パラメータ事前分布を頻度論的推論に活用する原理を与え，（２）事後分布からのサンプリングを利用して頻度論的推論を実装し，（３）ニューラルネットなど大規模モデルでも有効性を検証する．このうち，本年度の概要は次の通り．・研究項目（１）と（２）について，簡単な確率モデルを用いて検討する．多変量正規分布の設定において，有効性を確認している．・研究項目（３）について，ニューラルネットの現実的な規模のモデルで基礎的な性質を確認する．具体的には，単語の分散表現（単語ベクトル）の学習において，ランジュバン動力学にもとづくMCMCを実装した．その結果，これがベイズの事後分布からのサンプリングの近似として有効であるが，一方でMCMCの収束性について十分に検討すべきであることがわかった．また，静的な単語ベクトルだけでなく，言語モデルに見られる動的な埋め込み等の様々な状況で学習の実験を行い，表現学習における埋め込みの性質を調べた．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由理論研究とその実証実験，および自然言語処理等への応用で一定の成果があった．
今後の研究の推進方策	今後も自然言語処理などの応用をすすめて得られる知見を理論研究に生かしつつ，理論的な興味に基づいた研究も発展させる．

報告書

(1件)

2023 実績報告書

研究成果
(9件)

すべて 2024 2023

すべて雑誌論文 (4件) (うち査読あり 4件、オープンアクセス 4件) 学会発表 (5件)

[雑誌論文] 3D Rotation and Translation for Hyperbolic Knowledge Graph Embedding2024
- 著者名/発表者名
  Yihua Zhu, Hidetoshi Shimodaira
- 雑誌名
  
  Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics (Volume 1: Long Papers)
  
  巻: 1 ページ: 1497-1515
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Improving word mover's distance by leveraging self-attention matrix2023
- 著者名/発表者名
  Yamagiwa Hiroaki, Yokoi Sho, Shimodaira Hidetoshi
- 雑誌名
  
  Findings of the Association for Computational Linguistics: EMNLP 2023
  
  巻: 1 ページ: 11160-11183
- DOI
  10.18653/v1/2023.findings-emnlp.746
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Norm of Word Embedding Encodes Information Gain2023
- 著者名/発表者名
  Oyama Momose, Yokoi Sho, Shimodaira Hidetoshi
- 雑誌名
  
  Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing
  
  巻: 1 ページ: 2108-2130
- DOI
  10.18653/v1/2023.emnlp-main.131
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Discovering Universal Geometry in Embeddings with ICA2023
- 著者名/発表者名
  Yamagiwa Hiroaki, Oyama Momose, Shimodaira Hidetoshi
- 雑誌名
  
  Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing
  
  巻: 1 ページ: 4647-4675
- DOI
  10.18653/v1/2023.emnlp-main.283
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[学会発表] 依存関係の大きさは意味の関連性を表す2024
- 著者名/発表者名
  大山百々勢，山際宏明，下平英寿
- 学会等名
  言語処理学会第30回年次大会(NLP2024)
- 関連する報告書
  2023 実績報告書
[学会発表] 大規模言語モデルにおける幻覚緩和のための単語確率の外挿2024
- 著者名/発表者名
  何昀臻，高瀬侑亮，石橋陽一，下平英寿
- 学会等名
  言語処理学会第30回年次大会(NLP2024)
- 関連する報告書
  2023 実績報告書
[学会発表] ランジュバンモンテカルロ法を用いた単語埋め込みのベイズ推論2023
- 著者名/発表者名
  橋本竜馬, 下平英寿
- 学会等名
  2023年度統計関連学会連合大会
- 関連する報告書
  2023 実績報告書
[学会発表] Hyperbolic space operations and general representations of relation and entity for knowledge graph embedding2023
- 著者名/発表者名
  Zhu Yihua, Hidetoshi Shimodaira
- 学会等名
  第26回情報論的学習理論ワークショップ (IBIS2023)
- 関連する報告書
  2023 実績報告書
[学会発表] 独立成分に基づく埋め込み表現の解釈と普遍的形状の解明2023
- 著者名/発表者名
  大山百々勢, 山際宏明, 下平英寿
- 学会等名
  第26回情報論的学習理論ワークショップ (IBIS2023)
- 関連する報告書
  2023 実績報告書

事前分布を活用する頻度論的推論

研究代表者

下平 英寿 京都大学, 情報学研究科, 教授 (00290867)

18,460千円 (直接経費: 14,200千円、間接経費: 4,260千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] 3D Rotation and Translation for Hyperbolic Knowledge Graph Embedding2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Improving word mover's distance by leveraging self-attention matrix2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Norm of Word Embedding Encodes Information Gain2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Discovering Universal Geometry in Embeddings with ICA2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] 依存関係の大きさは意味の関連性を表す2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大規模言語モデルにおける幻覚緩和のための単語確率の外挿2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] ランジュバンモンテカルロ法を用いた単語埋め込みのベイズ推論2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Hyperbolic space operations and general representations of relation and entity for knowledge graph embedding2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 独立成分に基づく埋め込み表現の解釈と普遍的形状の解明2023

著者名/発表者名

学会等名

関連する報告書

下平英寿京都大学, 情報学研究科, 教授 (00290867)