研究課題/領域番号 |
21K11782
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 金沢大学 |
研究代表者 |
寒河江 雅彦 金沢大学, 経済学経営学系, 教授 (20215669)
|
研究期間 (年度) |
2021-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2025年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | ノンパラメトリック / 局所モーメント / メッシュ化データ / ビン化データ / スプライン平滑化 / ノンパラメトリック統計 |
研究開始時の研究の概要 |
画像・地図・交通ビッグデータ等では予めメッシュ単位にデータは集約され、分析を行う。このメッシュデータ分析はメッシュの構成法次第で結果に大きく影響を与える。私たちは、これまでの研究で予めグループ化(ビン化)したビン化データに局所的なモデリングを行うことで推定精度を高めるノンパラメトリック統計モデルの構築とその性質を研究してきた。 本研究では、メッシュデータとビン化データの類似点に着目し、画像・地図・交通データ分析で用いられるメッシュデータの統計的データ変換法の研究を行う。メッシュデータ解析の精度向上に繋がる汎用性のあるデータ変換法を開発し、機械学習・AIと統計学をつなぐ研究を実現する。
|
研究実績の概要 |
私たちは、予めグループ化(ビン化)したデータに局所的なモデリングを行うことで推定精度を高めるノンパラメトリック統計モデルの構築とその性質を研究してきた。 この目的は、大規模データの縮約化と縮約に伴う情報損失とその影響による精度低下を不可情報を加えることで同時に改善することを目指している。 本研究では、メッシュデータとビン化データの類似点に着目し、画像・地図・交通データ分析で用いられるメッシュデータの統計的データ変換法の研究を行う。メッシュデータ解析の精度向上に繋がる汎用性のあるデータ変換法を開発し、機械学習・AIと統計学をつなぐ研究を実現することが目標である。 2022年度は、ビン内の局所モーメント制約を満たしつつ、ビン端点での微分連続性を満たす条件下での推定精度の改良ができるかどうかの理論的な研究を開始し、理論的に改良できることを示した。また、理論は漸近論に基づいた大標本特性であるが、シミュレーション実験では、小標本においても概ね理論的な改良がなされることを確認した。この性質から、ビン化することで計算量を大幅に削減しつつ、同時に理論的な精度も上げていく見通しが立てられるようになった。 2023年度以降の目標は、多次元化の方向で研究を進めていく。2,3次元の画像等の実際の問題で用いられる次元でのこれまで1次元で行われたモデル多次元化を目指す。具体的には、テンソル型スプラインによる曲面モデリングをヒントに、統計モデルを作詞し、その理論的な精度を導くことを目指している。また、その延長上で更なる高次元でのテンソル型スプライン密度推定法の開発と理論的な性質を明らかにする。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
理由 当初は、本テーマでの共同研究者であるDavid Scott 教授(米国、ライス大学)での共同研究を発展させ、米国の国際学会で最新の情報を入手し、本研究をさらに 展開する計画であった。しかしながら、2022年度もコロナによる渡米の制限、国際学会も現地では開催されたが、参加する機会が困難であった。また、国内の学会やシンポジウムも多くがオンライン会議では参加したものの、情報不足は否めなかった。この1年は、私のアイディアでモデリングした推定モデルの理論解析とシミュレーションによる検証までを行った。ただし、本成果は、統計連合学会2022年度、ノンパラメトリック統計解析とベイズ統計のシンポジウムですべてオンラインで実施した。合わせて、本年度の成果を学会報告等では数回行っている。 今年度は、共同研究のメリットを生かし、米国の共同研究者であるDavid Scott教授(ライス大学)との研究を再開し、本研究テーマでの研究を加速させたい。
|
今後の研究の推進方策 |
2023年度以降の3年間で、高次元大規模データに関するビン型密度推定のモデルとして、局所モーメント情報とビン境界での微分連続性を加えたモデリングをまとめ、理論的な整備による一般論の完成に取り組んでいく。特に画像等のメッシュ情報については、2次元データ解析が応用上特に重要であり、多次元への拡張を考えつつ、2次元の画像の推定、復元の問題を特に集中して取り組んでいく予定である。 海外共同研究者とは役割分担を明確にして、ライス大学Scott教授は大規模データのノンパラメトリック統計学での理論研究を進めていく。対面と共に電子会議や電子メールを利用して意見交換しながら、研究を効率よく実施できる。 学内研究協力者の藤生慎准教授は本研究の応用面で中心的な役割を担っている。同じ大学内で頻繁に研究打ち合わせ、研究協力が得られる環境で実施していく。 今後の展開は、元データからビン化データへ、画像データに読み替えると、ピクセルからメッシュに変換することで情報損失が生じる。私たちの一連の研究はビンデータを適切に処理することで元データによる推定と同程度の推定精度を確保できることを示している。ビン内の局所モーメント情報を使うことで推定精度をさらに改良できることを示した。そこでメッシュデータの前処理法として、ノンパラメトリック統計理論で蓄積してきた方法を画素データ等のメッシュ化データに適応する一般化を目指している。
|