2017 Fiscal Year Research-status Report
Theory and Application for high dimensional discrete data
Project/Area Number |
17K05373
|
Research Institution | Tokyo University of Science |
Principal Investigator |
田畑 耕治 東京理科大学, 理工学部情報科学科, 講師 (30453814)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 正方分割表解析 / スパース推定 / モデル選択 |
Outline of Annual Research Achievements |
二元分割表および多元分割表における対称性や非対称性のモデルは数多く提案されており、あるデータに対して複数のモデルの適合度が良い場合に、どのモデルを選択するかという問題が生じる。各モデル間に包含関係が存在する場合には、尤度比検定統計量の差を用いてモデル間の比較をすることが可能であることが知られている。一方で、各モデル間に包含関係が存在しない場合には、AICやBICに代表されるモデル選択基準を用いることが一般的である。 本研究では、分割表解析におけるモデル選択の方法として、L1型正則化法を応用することを考えた。実際に、多元分割表解析において独立性および条件付き独立性などに関するモデルの選択問題にL1型正則化法を用いた研究(Nardi and Rinaldo, 2012)が存在し、その効果が実証されている。また機械学習の分野では、分割表解析においてベイズ論的アプローチとLassoを組み合わせた研究が行われている(Raman, Fuchs, Wild, Dahl and Roth, 2009)。これらの先行研究は、すべて分割表解析における独立性や条件付き独立性に関連するモデルの研究である。したがって、これらの先行研究を対称性のモデルへの適用が可能になるように拡張を行った。実際に、LassoとElastic Netを実装した。さらに、それらの拡張であるAdaptive LassoとAdaptive Elastic Netも実装した。それぞれの罰則項を用いて、実データ解析を行い良好な結果を得ることに成功し、これまでよりも詳細な分割表データの解析が可能になった。同時に、それらのスパース推定から得られる推定量の性質に関する数理面の研究も順調に解明されつつある。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
正方分割表解析において、対称性のモデルのクラスを定義し、そのクラスのなかにあるモデルの中から最適なモデルを選択する問題を考えた。この場合、包含関係にないモデルも含まれているため、従来のような尤度比カイ二乗統計量の差を用いることができない。また、AICやBICなどのモデル選択基準を用いる方法も考えられるけれども、その場合はカテゴリ数の増加に伴い候補となるモデルの数が指数的に増加するため得策ではない。したがって、スパース推定の方法を利用することにした。実際に、スパース推定のアルゴリズムを計算機に実装することに成功した。実データ解析を行い、概ね良好な結果を得ることにも成功した。また、得られる推定量の数理的な性質に関する研究も順調に進んでいる。今後、スパース推定に用いるチューニングパラメータの選択問題についても考えたい。また、推定量の漸近的な性質や罰則項の改良なども検討したい。
|
Strategy for Future Research Activity |
現在、罰則項としてLassoとElastic Netの実装に成功した。また、それらの改良として、Adaptive LassoとAdaptive Elastic Netの実装も完了している。今後は、SCADやその重み付きの方法などの研究を進めたい。また、それらの方法から得られる推定量の性質およびモデルの選択に関する性質など応用・理論の両面から研究を進めたい。さらに、正方分割表解析の枠組みに囚われることなく、一般の分割表解析における問題への応用や、ゲノムデータに代表されるような小サンプル高次元データにおける推定問題への適用についても検討したい。
|
Causes of Carryover |
今年度、計算機(物品)の購入を見送った。その理由は、オーストラリアで開催されたBiometrics by the Borderへの旅費が必要となったからである。次年度は、計算機の購入と国際会議への参加を予定しているため、計画的な予算の利用が見込まれる。
|
Research Products
(2 results)