• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

データの層別に有用な外部情報を視覚的に把握するための統計手法の開発

研究課題

研究課題/領域番号 20K19755
研究種目

若手研究

配分区分基金
審査区分 小区分60030:統計科学関連
研究機関岡山大学 (2022-2023)
大阪大学 (2020-2021)

研究代表者

高岸 茉莉子  岡山大学, 環境生命自然科学学域, 講師 (00842147)

研究期間 (年度) 2020-04-01 – 2026-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワードグラフ / 対応分析 / 視覚化 / クラスタリング
研究開始時の研究の概要

本研究では離散データに対し,外部情報をうまく用いてデータの特徴を視覚的に把握するの手法開発を行う.具体的には,メイン変量(例,商品への購買意欲)と外部情報(性別,世帯など)が与えられた時に,どの外部情報(例:男性)及び外部情報の組み合わせ(例:男性かつ一人暮らし,など)が,メイン変量の特徴づけに有効かを把握できるような手法を開発する.そのために外部情報とメイン変量間の関係をグラフとして表現し,その関係が把握できるような分割を考える.また組み合わせ最適化問題との関連付けも行うことで,効率的に解く方法を導出する.

研究実績の概要

本研究では、データの特徴を視覚的に把握するための手法開発を行っている.この手法では,性別や国籍などのカテゴリカル変量によって表されるクラス情報を外部情報として扱っており,各クラスの中で複数の傾向を抽出することを可能にしている.またそれらを共通の低次元空間上に同時に配置することで,少数グループの傾向も視覚的に把握しやすくしている.具体的には,カテゴリカル変量向けの次元縮約クラスタリング法であるCluster Correspondence Analysisを,外部情報ごとに低次元でクラスタリングできるように拡張した.そのため推定アルゴリズムなどもシンプルなものとなっている.またこの手法は,すでに提案された外部情報と組み合わせるための線形行制約を伴うアプローチとも関連があり,本研究ではその関係性も具体的に示した.
本研究において,最初は全てクラス内の複数の傾向を抽出するための変量も,全てカテゴリカル変量であることを想定していたが,現在は量質混合変量にも対応できるように拡張している.具体的には,本提案手法は質的変量向けの次元縮約クラスタリング法であるCluster CAを拡張したものであるが,それと量的変量向け次元縮約クラスタリング法であるReduced k-meansとの関係を考察し,それをもとに本提案手法を量的変量,さらに量質混合変量にも対応できるように拡張した.またその手法を統計プログラミング言語R上で実装した.さらに高速な計算も可能とするためにRcppで実装している.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

現在までに,カテゴリカル変量のみの場合の手法の推定の高速化と,その手法の量質混合変量への拡張をおこなっている.またそのパッケージに関する論文も現在執筆中である.

今後の研究の推進方策

量質混合変量への拡張をおこなったことで,実データ応用範囲が増えたため,例えばマーケティングデータなど,本手法適用が有用と考えるデータへの適用と,その活用方法をまとめた論文を執筆したいと考えている.また現段階では外部変量は事前に固定したものを用いているが,よりメイン変量群が解釈しやすいように分割されるような外部変量を探索するようなアプローチも開発したいと考えている.

報告書

(4件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 研究成果

    (2件)

すべて 2022 その他

すべて 国際共同研究 (1件) 雑誌論文 (1件) (うち国際共著 1件、 査読あり 1件、 オープンアクセス 1件)

  • [国際共同研究] Erasmus University Rotterdam(オランダ)

    • 関連する報告書
      2021 実施状況報告書
  • [雑誌論文] Visualizing Class Specific Heterogeneous Tendencies in Categorical Data2022

    • 著者名/発表者名
      Takagishi Mariko、Velden Michel van de
    • 雑誌名

      Journal of Computational and Graphical Statistics

      巻: - 号: 3 ページ: 790-801

    • DOI

      10.1080/10618600.2022.2035737

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著

URL: 

公開日: 2020-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi