2021 Fiscal Year Annual Research Report
Project/Area Number |
19K20226
|
Research Institution | Doshisha University |
Principal Investigator |
土田 潤 同志社大学, 文化情報学部, 助教 (40828365)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 次元縮約法 / 多変量解析 / Gini 係数 / 潜在変数モデル |
Outline of Annual Research Achievements |
様々な学問分野で大規模複雑データ(ビッグデータなど)が利活用されている.大規模複雑データを扱うための前処理の1つとして,多くの変量をまとめることで新たな変量を得る次元縮約法が適用されることが多い.しかし,大規模複雑データに既存の次元縮約法を適用すると,新たな変量の解釈が困難である場合が多い.さらに,解釈が容易でない前処理を行った場合,本分析で得られた結果を誤って解釈する恐れがある.“解釈容易性”の議論は実用上極めて重要であるが,現在,積極的な議論はなされていない.そこで本研究では,Thurston(1947) が言葉でのみ定義した解釈容易性を,式によって表現することを目標とした.本研究では,主にGini Index を用いて解釈容易性が定義できるかを検証し,解釈容易性を最大化する次元縮約法を開発した.その有用性を数値例とリアルデータによって検討した. Gini Indexは,関係のない変量を0とし関係ないとするような機能はそれに特化した指標に比べて劣るが,推定値のメリハリがつき解釈が容易になる傾向が見て取れた.そこで,Gini Indexを大きくするような次元縮約法とそれに関連する手法を開発した.開発した手法は,具体的に,主成分分析法,因子回転法,Tensor dataに対する次元縮約法の3つである.これらの成果は,学会発表を通じて世間に公表した.また,Gini Indexを大きくするような方法を開発する過程で,いくつかのマジョライジング関数を導出し,パラメータ推定法のアルゴリズムを開発した.
|