2014 Fiscal Year Research-status Report
Project/Area Number |
26330039
|
Research Institution | Osaka University |
Principal Investigator |
足立 浩平 大阪大学, 人間科学研究科, 教授 (60299055)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 多変量解析 / スパース因子分析 / スパース主成分分析 / ペナルティ・フリー / 交互最小二乗法 |
Outline of Annual Research Achievements |
当初,ペナルティなしのスパース主成分分析(PCA)の研究開発を行った後に,スパース直交因子分析(FA)の研究開発に着手する予定であったが,両手法のフォーミュレーションが類似することが判明したため,平行して研究開発することにした.その実績を以下に記す.まず,考案したスパースPCAは,変数×成分の負荷行列の0要素数が所与の整数であり,かつ,個体×成分の(主成分)得点行列が列正規直交であるという制約のもとに,「得点行列の後ろから負荷行列の転置を乗じた積」と「個体×変数のデータ行列との差の二乗ノルム(目的関数)」を最小にする負荷行列と得点行列を求める方法である.一方,考案したスパース直交FAは,上記スパースPCAの「得点行列の後ろから負荷行列の転置を乗じた積」の部分が,「」内の積と,独自因子得点行列と独自分散の平方根の対角行列の積の和に代わり,負荷行列と独自分散が求めるべきパラメータとなる.以上のスパースPCA・直交FAともに, 二乗ノルムは,2つの二乗ノルムfとgの和に分割され,fは得点行列の後ろから変数×成分の共分散行列の転置を乗じた積とデータ行列との差の二乗ノルムであり,gは変数×成分の共分散行列と負荷行列の差の二乗ノルムである. 以上の分割を利用して, gを最小にする負荷行列を求めると,f+gを最小にする得点行列を求めるステップを交互反復するアルゴリズムを構成した.なお,局所解を避けるために,複数ランダム初期値から得られる複数解の中で最小目的関数値の解を選ぶ手続きをとった.以上の作業の後,むしろ,スパース直交FAの論文化を先行した方がよいと考え,それのコンピュータプログラムを作成した.そして,シミュレーションによって,パラメータの再現精度の良さを確認した.さらに,実データへの適用を通して有用性を例証した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初,ペナルティなしのスパース主成分分析(PCA)の研究開発を行った後に,スパース直交因子分析(FA)の研究開発に着手する予定であったが,平行して研究開発を行い,スパース直交FAの研究を先行させ,わずかな課題を残して,ほぼ完成間近となった.一方,スパースPCAについては,コンピュータ・プログラムの作成の後にシミュレーションと実データへの適用が残り,行う課題内容は入れ替わったが,達成した研究の容量は,当初の予定と同じであったため.
|
Strategy for Future Research Activity |
まず,本年度に行ったスパース直交FAとスパースPCAについて,残った課題を行う.前者については,最適な0要素数の選択法を確定することである.一方,後者については,コンピュータ・プログラムの作成の後にシミュレーションと実データへの適用を行う.また,既存のスパースPCAが重み行列をスパースにするのに対して,開発手法はむしろ負荷行列をスパースにする方法であるが,負荷行列を解釈対象とすることの説得的な議論の構成を行う. 以上を完了すれば,各変数が単一因子に負荷するAを求めるスパースFAの特殊ケースを考える.これはスパースさが最大の解を求める方法であるので,スパーセストFAといえる.それが有用性を発揮する場面は,変数を互いに排反なクラスターに分類したい場合である.このスパーセストFAについて, 最小二乗法とともに最尤法に基づくものを開発して,シミュレーションによってパラメータの真値再現精度を確認し,実データへの適用によって,有用性を例証する. その後,最小二乗法によるスパース斜交FAを開発する.これはスパース直交FAの因子の直交制約を緩めた問題である.さらに,最尤法によるスパース直交・斜交FAを開発する.その解法には,EMアルゴリズムを利用することを考えている.いずれの開発手法についても,そのコンピュータプログラムを作成して,シミュレーションによって,0要素の同定の精度・パラメータの真値再現精度を確認する.そして,実データへの適用によって,開発手法の有用性を例証する.
|
Research Products
(21 results)