2012 Fiscal Year Annual Research Report
シンボリックデータ解析による大規模及び複雑なデータに対する解析法の研究
Project/Area Number |
12J02466
|
Research Institution | Osaka University |
Principal Investigator |
寺田 吉壱 大阪大学, 基礎工学研究科, 特別研究員(DC2)
|
Keywords | シンボリックデータ解析 / 多次元尺度構成法(MDS) / 非対称非類似性データ / 制約付き最適化 / クラスタリング法 / 次元縮約 / 最小コントラスト推定量 / 強一致性 |
Research Abstract |
本年度は,大規模及び複雑な非類似性データに対するMDSの研究と次元縮約とクラスタリング法の同1時分析法に関する研究を行った.MDSに関する研究では,これまで扱ってきたパーセンタイル値非類似性データに対するMDSの最も一般的なモデルであるnon-concentric modelを提案した.また,このnon-concentric hyperbox modelの最適化は複雑な制約付き最適化となり最適化が困難であったが,パラメータの置き方によっては無制約の最適化問題に帰着できることを示した.さらに,非対称非類似性データに対するMDSについても既存のモデルであるradius distance modelの一般化を行った.radius distance modelは,対象を超球で表現し,非対称性を球の半径で表現するモデルであり,例えばブランドスイッチデータを視覚化すると商品のブランド力の強弱が半径の大小で表現される.しかし,これのモデルでは,特定の商品への流出が起こりやすいといった方向のある非対称性が上手く表現できない.そこで,各対象が回転を許した一般楕円体で表現されるモデルへと拡張した.本モデルを用いることで,非対称性の方向も表現が可能となった.例えば,どの商品からどの商品へブランドスイッチが起きやすいかという重要な性質を視覚化することができる.いずれの提案手法も国際誌への投稿に向け,論文執筆中である. 次元縮約とクラスタリング法の同時分析法に関する研究では,これまでに提案されているRKM法とFKM法に関して,推定最が強一致性をもつための十分条件を明らかにした.クラスタリング法に関して本研究のような統計的性質の理論研究は少なく,非常に重要な結果を示すことができた.証明は,Blum-DeHardt typeの一様大数の強法則に基づいており,サンプルが定常かつエルゴード的であれば強一致性は成り立ち,i.i.d。性を必要としない.RKM法,については,i.i.d.性の仮定と確率分布の台が有界であるという条件の下で,収束レートを明らかにした.これらの結果については現在2本の論文を投稿中であり,査読中となっている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,大規模及び複雑な非類似性データに対するMDSの研究と次元縮約とクラスタリング法の同時分析法に関する研究を行い,どちらの研究においても一定の研究成果を残すことができている.MDSに関する研究では,提案手法を国際誌への投稿に向け,論文執筆中である.また,クラスタリング法に関する研究については,現在2本の論文を投稿中であり,査読中となっている.
|
Strategy for Future Research Activity |
クラスタリング法に関する研究は,手法の開発が主流となり,非常に多くの方法が提案されている.一方で,それら方法の統計的性質は十分に明らかにされていない.そのため,クラスタリング法の理論整備は非常に重要な課題である.そこで,spectral clusteringを中心にクラスタリング法の統計的理論を先駆的に研究されているvon Luxburg先生の下へ研究留学し,クラスタリング法の統計理論の研究を中心に行う.
|
Research Products
(7 results)