Project/Area Number |
22KJ1131
|
Project/Area Number (Other) |
22J22685 (2022)
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Multi-year Fund (2023) Single-year Grants (2022) |
Section | 国内 |
Review Section |
Basic Section 12040:Applied mathematics and statistics-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
高澤 祐槻 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2023-03-08 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,500,000 (Direct Cost: ¥2,500,000)
Fiscal Year 2024: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2023: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2022: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | 非ユークリッド統計 / 対数凹密度推定 / モード推定 / 合意樹 / ノンパラメトリック密度推定 / 対数凹密度 / 最尤推定 / 系統樹 / CAT(0)空間 |
Outline of Research at the Start |
系統樹は,生物学の多くの研究の基盤となるデータであり,これはある距離空間に埋め込まれることが知られている.本研究では,第一にこの空間における統計的推測の手法について考える.特に,ノンパラメトリックに扱える密度推定の方法を与え,その推定量の理論的性質について調べる.また,計算手法を開発し,実際の生物学のデータセットに応用する. 第二に,より一般の空間に対して開発した手法を拡張することなどにより,様々な空間やデータの制約のもとで用いることができる統計分析の手法を開発する.
|
Outline of Annual Research Achievements |
昨年度に引き続き,系統樹の系統樹の集合を分析する統計手法についての研究を進めた.系統樹のなす空間は通常のユークリッド空間とは異なる複雑な空間であることが知られている.この空間上での確率分布推定の手法として,対数凹密度の最尤推定の方法をこの空間に拡張できることを示した論文を投稿し,受理された.また,この推定手法は系統樹空間を含むより一般的な空間のクラスへ拡張可能であり,一致性や最尤推定量の一般化である対数凹射影の存在性などの理論的な性質について,国際学会等で発表を行った. さらに,系統樹の空間における代表的な中心の概念であるフレシェ平均やフレシェメジアンには,多分岐を持つ木が推定されやすいという問題がある.これを解決するため,新たな中心の推定問題としてモード推定を考え,多次元ユークリッド空間上でのモード推定量の一般化や,これまで研究を行なった密度推定の手法の応用を考えることにより,いくつかの推定量を提案した.また,これらの推定量の一致性や頑健性に関する性質についても調べ,数値的に精度を比較した.これらの内容についても国内学会にて発表をした. さらに,古典的な系統樹の集合のまとめのための手法である合意樹の形成方法についても研究を進めた.実用的に最も多く用いられている手法は多数決合意樹であるが,系統シグナルが小さい場合に多分岐が多く情報の少ない木を出力してしまうことがある.多数決合意樹の最適化する距離が枝の有無のみを考慮しているという点に着目し,より柔軟で詳細な木の構造を考慮する評価関数とその最小化を考えることで,情報を多く含んだ木を出力できることを観察した.一般的にそれらの評価関数の最適化は難しいが,適切な初期木を与えることや,貪欲アルゴリズムの適用を通した最適化手法を提案し,そのパフォーマンスを検証した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題の主題である,系統樹の空間における統計手法の開発に関しては,対数凹密度の最尤推定という確率密度推定の手法についてまとめた論文を投稿することができた.さらに,別の推定問題としてモード推定の問題についても考え,いくつかの推定量とその性質について考察することができた.また,当初予定していた高次元への対数凹密度推定の拡張は難しいことがわかった一方で,そのような状況における別のアプローチとして,古典的な合意樹の枠組みにおいて新しい手法の研究を進めることができた.
|
Strategy for Future Research Activity |
これまでに研究した対数凹最尤推定量の理論的な性質や,新たに提案したモード推定量について,論文執筆を進める.さらに,合意樹の改善手法について,数値実験によるシミュレーションを進める.また,その際に必要となる最適化の手法についても研究を進める.さらに,実データへの適用を通して実用性の検証を行う.
|