研究課題/領域番号 |
22K12153
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 芝浦工業大学 |
研究代表者 |
神澤 雄智 芝浦工業大学, 工学部, 教授 (00298176)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | クラスタリング / 超球面時系列データ |
研究開始時の研究の概要 |
超球面クラスタリングは文書データの構造化等によって重要な手法として位置づけられているが、経時的に変化していく超球面データの取扱に関する方法論的基盤が整っているとはいえない。 本研究では、超球面時系列データのためのクラスタリング技法を確立することを目的とし、さらに、従来法と開発技法との数理的関連性を通じて、超球面時系列データのためのクラスタリングの理論的発展および実用化を目指す。 その研究方法として、複数の異なるアプローチ、およびこれらの組み合わせに基づく手法群を開発し、これらの数理的性質を明らかにすると共に、人工データと実データを用いて、従来法に対して精度に関する優位性を定量的に示す。
|
研究実績の概要 |
本研究では、超球面時系列データのためのクラスタリング技法を確立することを目的とし、さらに、従来法と開発技法との数理的関連性を通じて、超球面時系列データのためのクラスタリングの理論的発展を目指す。 その研究方法として、ノンパラメトリックアプローチ、パラメトリックアプローチ、エンベッドアプローチに基づく手法群を開発していく。また、超球面時系列データのためのクラスタリング手法を開発するにあたって、リニア時系列データのためのクラスタリング手法群が未整備である状況を踏まえて、リニア時系列データのためのクラスタリングについてもその開発を進める。 クラスタサイズ調整変数を含めない方が精度が高いケースが少なからずあったことを踏まえ、クラスタサイズ調整変数を含むリニアデータのためのクラスタリングの分類特性を明らかにするために一般化された最適化問題を設定してそこから得られる幾つかの具体例の分類特性を検証した。 ノンパラメトリックアプローチについては、リニア時系列データ間の非類似度としてしばしば用いられている動的時間伸縮法の多変量時系列に拡張された幾つかの変種を用いる方法について、クラスタリングする際に必要なFrechet平均を得ることが簡単ではないことが分かってきた。また、Shape-based距離を多変量時系列に拡張しようとしたが、リニアデータの場合と異なって固有値問題に帰着しなかった。 パラメトリックアプローチについては、状態が潜在変数であるモデルについては非ガウス型状態空間モデルを踏まえなければならないことが判明して研究を中断している。エンベッドアプローチについて開発した手法について、人工データ実験を通して手法間の分類特性を検証しつつ、実データ実験を通して手法間の精度比較をし始めている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
超球面時系列データ間の非類似度の開発を軸としたノンパラメトリックアプローチについては、リニア時系列データ間の非類似度としてしばしば用いられている動的時間伸縮法の多変量時系列に拡張された幾つかの変種を用いる方法について、クラスタリングする際に必要なFrechet平均を得ることが簡単ではないことが分かってきた。それは、Frechet平均と対応する伸縮パスが整合しなければならないからである。適当な初期設定から始めてFrechet平均と伸縮パスを交互に更新する反復することを試みているが、十分に良い初期設定でないと収束しないため、良い初期設定を与えることを検討する必要がある。 Shape-based距離を多変量時系列に拡張しようとしたが、リニアデータの場合に対しては固有値問題に帰着したのに対して超球面データではより複雑な非線形方程式になり、これを数値的に解くことを試みているがその糸口を掴めていない。 超球面上の状態空間モデルに基づくパラメトリックアプローチについては、状態が潜在変数であるモデルについては非ガウス型状態空間モデルを踏まえなければならないことが判明して研究を中断している。
|
今後の研究の推進方策 |
超球面時系列データ間の非類似度の開発を軸としたノンパラメトリックアプローチについては、動的時間伸縮法の多変量時系列に拡張された方法について、Frechet平均を反復法で数値的に得る際の初期値の設定方法を検討していく。また、Shape-based距離を多変量時系列に拡張しようとしたが、リニアデータの場合に対しては固有値問題に帰着したのに対して超球面データではより複雑な非線形方程式になり、これを数値的に解くことを検討していく。 超球面上の状態空間モデルに基づくパラメトリックアプローチについては、状態が潜在変数であるモデルについては非ガウス型状態空間モデルを踏まえなければならないことが判明したので、逐次モンテカルロ法を適用することを検討していく。時系列データ間の非線形な類似度が潜在的に各データを超球面に埋め込むエンベッドアプローチについて、引き続き、人工データ実験を通して手法間の分類特性を検証しつつ、実データ実験を通して手法間の精度比較をしていく。
|