研究課題/領域番号 |
22K12153
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 芝浦工業大学 |
研究代表者 |
神澤 雄智 芝浦工業大学, 工学部, 教授 (00298176)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | クラスタリング |
研究開始時の研究の概要 |
超球面クラスタリングは文書データの構造化等によって重要な手法として位置づけられているが、経時的に変化していく超球面データの取扱に関する方法論的基盤が整っているとはいえない。 本研究では、超球面時系列データのためのクラスタリング技法を確立することを目的とし、さらに、従来法と開発技法との数理的関連性を通じて、超球面時系列データのためのクラスタリングの理論的発展および実用化を目指す。 その研究方法として、複数の異なるアプローチ、およびこれらの組み合わせに基づく手法群を開発し、これらの数理的性質を明らかにすると共に、人工データと実データを用いて、従来法に対して精度に関する優位性を定量的に示す。
|
研究実績の概要 |
本研究では、超球面時系列データのためのクラスタリング技法を確立することを目的とし、さらに、従来法と開発技法との数理的関連性を通じて、超球面時系列データのためのクラスタリングの理論的発展および実用化を目指す。 その研究方法として、超球面時系列データ間の非類似度の開発を軸としたノンパラメトリックアプローチ,超球面上の状態空間モデルに基づくパラメトリックアプローチ,時系列データ間の非線形な類似度が潜在的に各データを超球面に埋め込むエンベッドアプローチ,およびこれらの組み合わせに基づく手法群を開発し、これらの数理的性質を明らかにすると共に、人工データと実データを用いて、従来法に対して精度に関する優位性を定量的に示す。 超球面時系列データ間の非類似度の開発を軸としたノンパラメトリックアプローチについては,リニア時系列データ間の非類似度としてしばしば用いられている動的時間伸縮法の多変量時系列に拡張された幾つかの変種を用いる方法を開発しつつあり,Shape-based距離を多変量時系列に拡張することを試みている. 超球面上の状態空間モデルに基づくパラメトリックアプローチについては,状態と観測が等価である古典的時系列モデルについてはその誤差にvon Mises Fisher分布を仮定したモデルを開発しつつあるが,状態が潜在変数であるモデルについては古典的な線形ガウス型状態空間モデルを超球面に拡張することが難しく,リニア時系列モデルにおいていわゆる非ガウス型状態空間モデルを踏まえなければならないことが分かってきた.時系列データ間の非線形な類似度が潜在的に各データを超球面に埋め込むエンベッドアプローチについて,これに基づく幾つかの手法を開発しつつある一方で,埋め込む訳ではないが,安直にメドイドを用いる手法が適用できそうなことが分かってきた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
超球面時系列データ間の非類似度の開発を軸としたノンパラメトリックアプローチについては,リニア時系列データ間の非類似度としてしばしば用いられている動的時間伸縮法の多変量時系列に拡張された幾つかの変種を用いる方法を開発しつつあり,Shape-based距離を多変量時系列に拡張することを試みているが,計画していた実験までには至っていない.その原因は,超球面時系列データのためのクラスタリング手法はもちろんのこと,リニア時系列データのためのクラスタリング手法群についてもまだまだ未整備な状況であることが研究を進める上で分かってきて,それを整備する必要があるからである. 超球面上の状態空間モデルに基づくパラメトリックアプローチについては,状態と観測が等価である古典的時系列モデルについてはその誤差にvon Mises Fisher分布を仮定したモデルを開発しつつあるが,状態が潜在変数であるモデルについては古典的な線形ガウス型状態空間モデルを超球面に拡張することが難しく,リニア時系列モデルにおいていわゆる非ガウス型状態空間モデルを踏まえなければならないことが分かってきた.時系列データ間の非線形な類似度が潜在的に各データを超球面に埋め込むエンベッドアプローチについて,これに基づく幾つかの手法を開発しつつある一方で,埋め込む訳ではないが,安直にメドイドを用いる手法が適用できそうなことが分かってきた.これについては行き詰まりが生じた訳ではないが,他のアプローチを推進するために思いのほか時間をかけてしまって,計画していた実験までには至っていない.
|
今後の研究の推進方策 |
超球面時系列データ間の非類似度の開発を軸としたノンパラメトリックアプローチについては,動的時間伸縮法の多変量時系列に拡張された幾つかの変種を用いる方法の開発を推し進めつつ,Shape-based距離を多変量時系列に拡張することも検討していく. 超球面上の状態空間モデルに基づくパラメトリックアプローチについては,状態と観測が等価である古典的時系列モデルについてはその誤差にvon Mises Fisher分布を仮定したモデル開発を推し進めつつ,非ガウス型状態空間モデルに基づいた超球面上状態空間モデルについても検討していく.時系列データ間の非線形な類似度が潜在的に各データを超球面に埋め込むエンベッドアプローチについて,これに基づく幾つかの手法の開発を推し進めつつ,埋め込む訳ではないが,安直にメドイドを用いる手法についても開発して比較検討していく.
|