研究課題/領域番号 |
20K19755
|
研究機関 | 大阪大学 |
研究代表者 |
高岸 茉莉子 大阪大学, 基礎工学研究科, 特任助教(常勤) (00842147)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | グラフ / 対応分析 / 視覚化 / クラスタリング |
研究実績の概要 |
一般にデータ分析を行う際,対象をクラス分け(層別)した上でメイン変量群の解釈を行うことは有益である.例えばマーケティング調査データから顧客のtargetingを行う際も,「全対象は商品A(の購入意向が高い)」という情報より,「男性は商品Aだが,若者は商品B」,あるいは「男性かつ一人暮らしは商品A」といった情報の方が,実務上意義があると考えられる.本研究はこのようにメイン変量群と外部変量群(クラス分けに用いる変量)の関連を視覚的に把握するための手法開発を行う.ここで本研究では外部情報として性別,国籍などのクラス情報を表すカテゴリカル変量を想定する.まず上記目的を達成する単純な方法として,対象の座標をクラス(あるいはクラスの組み合わせ)ごとに平均をとり,それを 1つの座標点とする方法が考えられる.しかしこの方法ではクラス内の大多数の人が同じ傾向を持つ場合は,その傾向は視覚的にも解釈しやすい場合が多いが, 例えば大多数が似た傾向を持っている中,一部少人数の異なる傾向を持つ部分集団がいた場合,その集団の特定は難しくなる.そこで本研究ではまず,上記のように外部情報クラス内で複数の異なる傾向がある場合に,外部情報クラスごとに複数のクラスターを抽出し,それら全てを共通の低次元空間上に同時布置することで,少数グループの傾向でも視覚的に把握しやすいようにした.これにより,例え少人数のみが持つ傾向であっても,関連の強さの情報が保たれ,視覚化結果にも反映されやすくなる.また異なる外部情報クラスのクラスターを全て同じ空間上に布置することで,外部情報として複数の変量を用いることも可能となり,更に 異なる外部情報クラス間の関係も視覚的に解釈できる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年は本研究での第一段階とも言える提案手法について述べた論文が採択された.またそれに伴い,本手法をRで使えるようにするためのRパッケージも開発し,CRAN(Rの各種パッケージが世界中からアップロードされているサイト)にアップロード済みである.
|
今後の研究の推進方策 |
Rのパッケージ開発が済んだため,次は提案手法を様々な実データに適用し,その適用例も含めたRパッケージに関する論文の執筆を検討している.また現段階では外部変量は事前に固定したものを用いているが,よりメイン変量群が解釈しやすいように分割されるような外部変量を探索するようなアプローチも開発したいと考えている.
|
次年度使用額が生じた理由 |
新型コロナの影響により,論文査読が遅れ,次の研究に進みづらい状況にあったこと,また対面学会の機会が大幅に減り,研究をスムーズに進めることが困難であったことなどが挙げられる.今年度以降はパッケージ論文や,現段階の手法を拡張する論文の執筆も検討しているため,それに伴う対面での学会参加や,英文校閲代などに使用することを検討している.
|