研究課題/領域番号 |
22K12153
|
研究機関 | 芝浦工業大学 |
研究代表者 |
神澤 雄智 芝浦工業大学, 工学部, 教授 (00298176)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
キーワード | クラスタリング / 超球面時系列データ |
研究実績の概要 |
本研究では、超球面時系列データのためのクラスタリング技法を確立することを目的とし、さらに、従来法と開発技法との数理的関連性を通じて、超球面時系列データのためのクラスタリングの理論的発展を目指す。 その研究方法として、ノンパラメトリックアプローチ、パラメトリックアプローチ、エンベッドアプローチに基づく手法群を開発していく。また、超球面時系列データのためのクラスタリング手法を開発するにあたって、リニア時系列データのためのクラスタリング手法群が未整備である状況を踏まえて、リニア時系列データのためのクラスタリングについてもその開発を進める。 クラスタサイズ調整変数を含めない方が精度が高いケースが少なからずあったことを踏まえ、クラスタサイズ調整変数を含むリニアデータのためのクラスタリングの分類特性を明らかにするために一般化された最適化問題を設定してそこから得られる幾つかの具体例の分類特性を検証した。 ノンパラメトリックアプローチについては、リニア時系列データ間の非類似度としてしばしば用いられている動的時間伸縮法の多変量時系列に拡張された幾つかの変種を用いる方法について、クラスタリングする際に必要なFrechet平均を得ることが簡単ではないことが分かってきた。また、Shape-based距離を多変量時系列に拡張しようとしたが、リニアデータの場合と異なって固有値問題に帰着しなかった。 パラメトリックアプローチについては、状態が潜在変数であるモデルについては非ガウス型状態空間モデルを踏まえなければならないことが判明して研究を中断している。エンベッドアプローチについて開発した手法について、人工データ実験を通して手法間の分類特性を検証しつつ、実データ実験を通して手法間の精度比較をし始めている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
超球面時系列データ間の非類似度の開発を軸としたノンパラメトリックアプローチについては、リニア時系列データ間の非類似度としてしばしば用いられている動的時間伸縮法の多変量時系列に拡張された幾つかの変種を用いる方法について、クラスタリングする際に必要なFrechet平均を得ることが簡単ではないことが分かってきた。それは、Frechet平均と対応する伸縮パスが整合しなければならないからである。適当な初期設定から始めてFrechet平均と伸縮パスを交互に更新する反復することを試みているが、十分に良い初期設定でないと収束しないため、良い初期設定を与えることを検討する必要がある。 Shape-based距離を多変量時系列に拡張しようとしたが、リニアデータの場合に対しては固有値問題に帰着したのに対して超球面データではより複雑な非線形方程式になり、これを数値的に解くことを試みているがその糸口を掴めていない。 超球面上の状態空間モデルに基づくパラメトリックアプローチについては、状態が潜在変数であるモデルについては非ガウス型状態空間モデルを踏まえなければならないことが判明して研究を中断している。
|
今後の研究の推進方策 |
超球面時系列データ間の非類似度の開発を軸としたノンパラメトリックアプローチについては、動的時間伸縮法の多変量時系列に拡張された方法について、Frechet平均を反復法で数値的に得る際の初期値の設定方法を検討していく。また、Shape-based距離を多変量時系列に拡張しようとしたが、リニアデータの場合に対しては固有値問題に帰着したのに対して超球面データではより複雑な非線形方程式になり、これを数値的に解くことを検討していく。 超球面上の状態空間モデルに基づくパラメトリックアプローチについては、状態が潜在変数であるモデルについては非ガウス型状態空間モデルを踏まえなければならないことが判明したので、逐次モンテカルロ法を適用することを検討していく。時系列データ間の非線形な類似度が潜在的に各データを超球面に埋め込むエンベッドアプローチについて、引き続き、人工データ実験を通して手法間の分類特性を検証しつつ、実データ実験を通して手法間の精度比較をしていく。
|
次年度使用額が生じた理由 |
当初計画では計算機実験に必要な計算機使用料を相当計上していたが、大規模実験を推進するまでに研究が進まなかったからである。次年度に遅延している計算機実験を進めるための計算機使用料にすることを想定している。
|