2021 Fiscal Year Research-status Report
Dimension and variable selection, simultaneous estimation, and computational environment for information extraction from complex data
Project/Area Number |
21K11799
|
Research Institution | Okayama University of Science |
Principal Investigator |
森 裕一 岡山理科大学, 経営学部, 教授 (80230085)
|
Co-Investigator(Kenkyū-buntansha) |
黒田 正博 岡山理科大学, 経営学部, 教授 (90279042)
飯塚 誠也 岡山大学, 全学教育・学生支援機構, 教授 (60322236)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 数量化 / カテゴリカルデータ / 変数選択 / 非計量主成分分析 |
Outline of Annual Research Achievements |
本研究では、マーケティングや社会心理学の分野を想定し、(i)情報損失を最小限に抑えた大規模さの軽減、(ii)縮約した情報や複雑性の関係の効率的な把握、(iii)尺度混在データの処理とテキストデータの処理を含む分析手順の提供、(iv)対話的なインタフェースの提供、(v)計算の効率化を順に実現していくことを目的としており、本年度は、主として、(i)、(ii)、(iii)に取り組んだ。 (i)では、主成分分析による次元縮約を古典的統計手法に適用することと、テストや調査問題において無駄な項目を削除することの2つの方法で複雑さを軽減することに取り組み、寄与率の範囲で有効であることを確認した。(ii)については,予測変数と観測変数の間の共分散構造を探すため,部分的最小二乗法(PLS、Partial Least Square)の理論と計算過程を検討した。これらに基づき、(iii)として、カテゴリカルデータをPLSで扱うための手法を開発し、教育における実際の生活アンケートを基にした人工データでその性能を確認した。また、それまで実データでの検討がなされていなかった主成分分析における尺度混在データの変数(項目)選択について、消費者の意識データで手法の評価、選択変数の数の具体的な設定方法、元の項目の評価について検討をし、実用的な手順を明らかにした。前者の成果については、第11回国際統計協会アジア地区大会で発表し、後者は、同地区大会で発表するとともに、「Principal Component Analysis」に投稿・掲載となった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
【研究実績の概要】で述べた目的のうち、1年目の研究目標としていたことは、次の2点を除き、すべて着手、成果が得られた。未着手の2点は、(ii)での構造方程式モデル(SEM、Structure Equation Model)における手法の整理とテキストデータのカテゴリカルデータへの変換及びその分析であるが、いずれも2年目の計画に入れることで問題はなく、また、得られた成果であるカテゴリカルデータへのPLSの適用や主成分分析における項目選択の性能の評価は、1年目ながら、十分な成果が得られたと考える。なお、出張等を控えたため、海外を含め研究協力者との研究打合せは十分に行えなかった。
|
Strategy for Future Research Activity |
SEMの手法整理と非構造化データ(テキストデータ)の構造化の検討から始め、(i)~(iii)は引き続き継続して研究していく。また、2年目から着手する予定である(ii)のReduced k平均法の手順を流用した次元縮約と他の手法との同時推定手法の開発と、(iii)での各種提案手法の汎用化に取りかかり、これらの進展を見ながら、並行して(iv)の対話的インタフェースと(v)の加速化アルゴリズムについて検討していく。この(iv)と(v)に関連して、分散処理の親機にあたるサーバーを導入し、計画している成果をめざす。
|
Causes of Carryover |
繰越金が生じた理由は、学会参加を予定していた国際会議のすべてと、1件を除く国内会議のすべてが延期またはオンラインとなったため、これらのために計上していた旅費の支出がなかったこと、及び、論文の投稿料の請求が次年度に回ったことによるものである。投稿料は次年度に支払い、また、研究が予定通り進んでおり、新型コロナの状況にもよるが、研究打合せと研究成果発表を積極的に行うことで、繰り越し分を有効に使う予定である。
|