本研究では,情報源が複数存在するような非類似性データを想定して,新たな解析法の開発に取り組んでいる.特に,匿名化されたデータに対して適切な外部情報を付与して解析する多変量データ解析法の開発を行っている. 現在,大量のデータが自動的に収集蓄積されている状況にあるが,そのデータの活用は必ずしも順調なわけではない.自動的に収集されたデータの多くが個人情報を含んでおり,そのまま利用できないことが問題となっている.また,データの収集元が複数あり,そのデータの統合を考えた際に個人情報を保護しながら統一のデータプラットフォームを作るのは容易なことではない. このような問題意識を踏まえ,本研究においては,昨年度に引き続き,各変量の外部情報を用いた多変量解析手法の提案を行った.具体的には,カテゴリカルな外部情報を考慮した非対称多次元尺度更生法の提案,各種制約を取り入れた次元縮約とクラスタリング法の同時分析法の提案,外部情報を取り入れたUnfoldingの提案などを行った.これらは,上述のような秘匿されるべき情報(個人情報)を用いることなく,データを融合する際の方法として利用可能なものになると考えている.本研究を進めることで一般的な場合における匿名化されたデータの外部情報を利用した多変量解析法の開発につながると考えている.
|