2023 Fiscal Year Annual Research Report
Dimension and variable selection, simultaneous estimation, and computational environment for information extraction from complex data
Project/Area Number |
21K11799
|
Research Institution | Okayama University of Science |
Principal Investigator |
森 裕一 岡山理科大学, 経営学部, 教授 (80230085)
|
Co-Investigator(Kenkyū-buntansha) |
黒田 正博 岡山理科大学, 経営学部, 教授 (90279042)
飯塚 誠也 岡山大学, 全学教育・学生支援機構, 教授 (60322236)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 数量化 / カテゴリカルデータ / クラスタリング / 変数選択 / 加速化 / 主成分分析 |
Outline of Annual Research Achievements |
本研究では、マーケティングや社会心理学の分野を想定し、(i)情報損失を最小限に抑えた大規模さの軽減、(ii)縮約した情報や複雑性の関係の効率的な把握、(iii)尺度混在データの処理とテキストデータの処理を含む分析手順の提供、(iv)対話的なインタフェースの提供、(v)計算の効率化を順に実現していくことを目的としており、取り組んできた。 本年度は、これまでと同様に、(i)(ii)(iv)について、テストや調査問題において無駄な項目の特定と複雑さの軽減に継続的に取り組んだ。一方、昨年度から対象としているファジィc-平均法において、(iii)と(v)について、新たな取り組みを行った。(v)では、加速化手法の詳細な数値実験による評価、(iii)では、数量化と次元縮約を同時に行うことでカテゴリカルデータを扱える手法を開発することである。いずれも人工データや実データにより手法のよさを確認し、第8回日独分類シンポジウム、国際計算機統計協会のアジア地区大会、高次元データの統計計算とロバスト推定に関するシンポジウムで成果を発表した。 3年間を通じ、尺度混在と高次元のデータを既存手法で扱えるようにするための手法や手順を開発した。既存手法としては、主成分分析、部分的最小二乗法、ファジィc-平均法の各手法であり、それぞれ、非計量主成分分析による数量化、項目反応理論による特性値、数量化と次元縮約の同時推定を利用し、複雑性と大規模性の軽減を実現した。また、効率的に結果を得るために、変数の縮減と計算の加速化を提案し、性能評価を行うことで、提案手法の有効性が確認できた。
|