2021 Fiscal Year Research-status Report
ノイズを含む超球面データのためのクラスタリング方法論の確立
Project/Area Number |
19K12126
|
Research Institution | Shibaura Institute of Technology |
Principal Investigator |
神澤 雄智 芝浦工業大学, 工学部, 教授 (00298176)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | クラスタリング |
Outline of Annual Research Achievements |
本研究課題では,これまでに研究を推し進めてきた超球面クラスタリングを実世界,実社会の現象や事象への適用を可能とするための次の研究課題として,超球面ノイズデータのためのクラスタリング方法論を確立することを目的にすると共に,確立した手法を現実の識別システムや推薦システムに応用して実用に供することを目指す. 本年度は,裾野の重い確率密度分布を用いる手法について,要素分布の自由度を表すパラメータ推定のための超幾何関数に関する零点を数値的に得るのが難しいために,当該確率密度分布を近似するために導入したパラメータの数と近似精度との関係を明らかにした.結果的に,これまで開発してきた手法を実データに適用するのは非常に難しいと判断した.これを踏まえて,これまで開発してきた手法とは別の,裾野の重い確率密度分布に基づく新たな手法を複数開発して,人工データ実験を通してその有効性を示すことができ,この成果を国際会議で発表した. また,前年度に本研究を実問題に適用してきた中で,データにゆらぎが生じていたり,経時的に変化するデータに遭遇することが数多くあったことを踏まえて,時変球面データのためのクラスタリング手法を複数開発した. さらに,カーネルデータ解析と共クラスタリングに基づく手法の開発の準備として,リニアデータに立ち戻り,次元削減するための複数の新たな手法を複数開発して,人工データ実験を通してその有効性を示すことができた.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究の本年度計画では,ノイズを吸収するクラスタを仮定する手法と裾野の重い確率密度分布を用いる手法の実データに対する性能評価,および,カーネルデータ解析と共クラスタリングを用いる手法の開発を推し進めていくと共に,前年度に本研究を実問題に適用してきた中で,データにゆらぎが生じていたり,時変データに遭遇することが数多くあったため,これらにも適応する手法を合わせて開発していくことにしていた. カーネルデータ解析と共クラスタリングを用いる手法の開発の準備として,リニアデータに立ち戻って次元削減するための複数の新たな手法を開発して,人工データ実験を通してその有効性を示すことができたり,前年度に本研究を実問題に適用してきた中で,データにゆらぎが生じていたり,時変データに遭遇することが数多くあったことを踏まえて,時変球面データのためのクラスタリング手法を開発した点では研究が進展していると評価できる. 一方で,裾野の重い確率密度分布を用いる手法については,前年度に,要素分布の自由度を表すパラメータ推定のための超幾何関数に関する零点を数値的に得るのが難しいことが明らかになったために,当該確率密度分布を近似するために導入したパラメータの数と近似精度との関係を検証していくことにしていたが,パラメータが多いと数値検証が難しく,数値検証できる程度にパラメータ数を減らすと精度が著しく低下することが明らかになったため,開発してきた裾野の重い確率密度分布に基づく手法について引き続き研究を推し進めるのは非常に難しいと判断したためである.
|
Strategy for Future Research Activity |
本研究の本年度計画では,ノイズを吸収するクラスタを仮定する手法と裾野の重い確率密度分布を用いる手法の実データに対する性能評価,および,カーネルデータ解析と共クラスタリングを用いる手法の開発を推し進めていくと共に,前年度に本研究を実問題に適用してきた中で,データにゆらぎが生じていたり,時変データに遭遇することが数多くあったため,これらにも適応する手法を合わせて開発していくことにしていた. この中で遅れている,ノイズを吸収するクラスタを仮定する手法の実データに対する性能評価,および,クラスタが偏在する部分超球面を抽出する手法の開発についてを引き続き推し進めていくと共に,本年度に開発できた,リニアデータのための新たな,裾野の重い確率密度分布を用いる手法に基づいて,球面データのための新たな,裾野の重い確率密度分布を用いる手法を開発していく. また,前年度に本研究を実問題に適用してきた中で,データにゆらぎが生じていたり,時変データに遭遇することが数多くあったことを踏まえて開発した時変球面データのためのクラスタリング手法について,数理解析,および人工・実データに対する性能評価を行っていく.
|
Causes of Carryover |
コロナ禍の影響で,予定していた国際会議が延期になったために国外出張費および参加費の支出がなかったり,予定していた国内学会がオンライン開催になったために出張費支出がなかったり参加費支出が低く抑えられた.これらについては,まず,翌年度に延期になった国際会議の国外出張費や参加費にあてる.また,オンライン開催で参加費が低く抑えられる新たな学会での研究発表にあてる.さらに,実データ実験を実行するための高性能計算機を購入するか,クラウドコンピューティングサービスを利用することを検討する.
|
Research Products
(2 results)