• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

データ空間上の測地距離およびその変換に着目した統計解析

研究課題

研究課題/領域番号 22K03439
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分12040:応用数学および統計数学関連
研究機関慶應義塾大学

研究代表者

小林 景  慶應義塾大学, 理工学部(矢上), 教授 (90465922)

研究期間 (年度) 2022-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード幾何学的データ解析 / データ解析 / 機械学習 / 曲率 / 多様体学習 / 理論統計学 / 幾何学的統計学
研究開始時の研究の概要

本研究は,データがその上に分布している空間である「データ空間」や,データ分布がその上の1点に対応するような「統計モデル空間」のそれぞれについて,その測地距離空間(2点間の最短経路により距離が定義されている空間)としての性質に着目し,新しいデータ解析手法の開発と理論構築を目指す.機械学習等のより複雑な統計モデルは,データを単にベクトルとして扱うこれまでのモデルを直接当てはめることができないため,測地距離空間の性質を活かした解析を用いることにより,データ解析の精度向上が期待される.

研究実績の概要

本年度は,本研究により提案されたデータ集合の近傍グラフおよび計量錐を用いた距離変換によるデータ解析手法について,国際会議International Congress on Industrial and Applied Mathematics (ICIAM2023),Boston-Keio-Tsinghua Wokshop 2023で口頭発表し,また日本経済政策学会第80回全国大会において招待講演を行った.さらに,計量錐にデータグラフ構造を埋め込むことにより,データの階層構造を抽出する新し手法を提案し,英単語辞書データのWordNetで実際に解析を行った.その上で計算機代数ソフトウェアを用いて手法の妥当性の理論証明を行った.その得られた成果については,国際学術誌Mathematicsにおいて竹原大翼氏との共著論文として発表した.その一方で,心内辞書構造に関する折田充氏らの語彙構造研究グループとの共同研究においては,語彙サイズが異なる語学学習者の間でどのように心内辞書が異なるのかについて品詞ごとに詳細な調査解析を行った結果を学会発表および論文として発表した.さらに,拡散モデルによる画像生成を通常用いられる正規ノイズ以外のノイズを用いて実装する手法に関する海老澤優氏との研究,行列式点過程を用いたグラフのランダム生成の困難性に関する鴨志田陸氏との研究,Shapley Flowモデルを用いた欠測データの機械学習予測への影響の説明に関する風呂井啓人氏との研究のそれぞれについて,得られた知見と研究の課題について,IBIS2023において共同での学会発表を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

3年計画の2年目にあたる本年度は,昨年度の研究立ち上げにより構築した研究環境および人的ネットワークを発展させる形で研究を進めた.昨年度London School of Economicsを長期訪問してWynn氏との共同研究として始めた複数の研究テーマについて,引き続きブラッシュアップしたうえで論文執筆を続けており,その一方でWasserstein距離に関する新たなメンバーとの共同研究も開始した.また,この2年間で得られた成果を,複数の学会発表と学術論文として発表することができた.以上のことを踏まえて,本研究はおおむね順調に進展しているといえる.

今後の研究の推進方策

来年度は最終年度ということで,本研究で得られた成果を多くの学会発表および学術雑誌への論文として公表し,周知につとめる.また,研究の発展として,集中不等式を用いた機械学習の精度評価について,幾何学的データ解析を用いてより実用的な理論評価を構成することを目指す.一方で,拡散モデルによる画像生成やChatGPTなどの言語生成モデルについても,その実世界における重要性を鑑みて,幾何学的データ解析手法を応用できる可能性について探る.

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (16件)

すべて 2024 2023 2022 その他

すべて 国際共同研究 (2件) 雑誌論文 (3件) (うち国際共著 1件、 査読あり 3件、 オープンアクセス 1件) 学会発表 (11件) (うち国際学会 3件、 招待講演 2件)

  • [国際共同研究] London School of Economics(英国)

    • 関連する報告書
      2023 実施状況報告書
  • [国際共同研究] London School of Economics(英国)

    • 関連する報告書
      2022 実施状況報告書
  • [雑誌論文] Organization of the L2 English Mental Lexicon: A Comparison of Connectivity in Nouns, Adjectives, and Verbs Between Japanese EFL Learners with Different Vocabulary Sizes2024

    • 著者名/発表者名
      Mitsuru Orita, Kei Kobayashi, Richard Levin, Makoto Yoshii, Tadamitsu Kamimoto, Kazumi Aizawa
    • 雑誌名

      ARELE

      巻: 35 ページ: 65-80

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Representing Hierarchical Structured Data Using Cone Embedding2023

    • 著者名/発表者名
      Daisuke Takehara, Kei Kobayashi
    • 雑誌名

      Mathematics

      巻: 11(10) 号: 10 ページ: 2294-2294

    • DOI

      10.3390/math11102294

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 英語心内辞書の再構築・変容を促進する語彙学習プログラム―ネイティブ度診断テスト導入の効果―2023

    • 著者名/発表者名
      折田 充, 小林 景, 村里 泰昭, 相澤 一美, レイヴィン リチャード, 神本 忠光, 吉井 誠
    • 雑誌名

      ARELE

      巻: 34 ページ: 161-176

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [学会発表] Statistical Analysis with Geodesics and Curvature in Data Space2023

    • 著者名/発表者名
      Kei Kobayashi, Henry Wynn
    • 学会等名
      10th International Congress on Industrial and Applied Mathematics (ICIAM2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Novel geometric methods for data analysis focusing on curvature and geodesics in data space2023

    • 著者名/発表者名
      Kei Kobayashi
    • 学会等名
      Boston-Keio-Tsinghua Wokshop 2023
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] データ空間の幾何学的特徴に着目した新しい解析手法2023

    • 著者名/発表者名
      小林景
    • 学会等名
      日本経済政策学会第80回全国大会
    • 関連する報告書
      2023 実施状況報告書
    • 招待講演
  • [学会発表] DDPMにおけるノイズ分布についての考察2023

    • 著者名/発表者名
      海老澤優, 小林景
    • 学会等名
      第26回情報論的学習理論ワークショップ (IBIS2023)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 行列式点過程によるグラフサンプリング2023

    • 著者名/発表者名
      鴨志田陸, 小林景
    • 学会等名
      第26回情報論的学習理論ワークショップ (IBIS2023)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 欠測データに対する機械学習モデルの判断根拠可視化2023

    • 著者名/発表者名
      風呂井啓人, 小林景
    • 学会等名
      第26回情報論的学習理論ワークショップ (IBIS2023)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] データ空間の計量に着目した多様体学習の評価2023

    • 著者名/発表者名
      服部航大,小林景
    • 学会等名
      第17回統計学会春季集会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] ロバストダイバージェンスに基づく事後分布構成法の改良2023

    • 著者名/発表者名
      山下亮,小林景
    • 学会等名
      第17回統計学会春季集会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Data analysis focusing on geodesic distance and curvature2022

    • 著者名/発表者名
      Kei Kobayashi, Henry P. Wynn
    • 学会等名
      Algebraic Statistics 2022
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] 熟達度の異なる大学生の英語心内辞書における名詞群の階層構造2022

    • 著者名/発表者名
      折田 充, 村里 泰昭, 小林 景, 吉井 誠, Richard Lavin, 神本 忠光, 相澤 一美
    • 学会等名
      第50回九州英語教育学会佐賀研究大会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 英語心内辞書の再構築・変容を促進する語彙学習プログラム ―ネイティブ度診断テスト導入の効果2022

    • 著者名/発表者名
      折田 充, 小林 景, 村里 泰昭, 吉井 誠, Richard Lavin, 相澤 一美
    • 学会等名
      全国英語教育学会第47回北海道研究大会
    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi