2018 Fiscal Year Research-status Report
複数情報源非類似性データに対するデータマッチング法に関する研究
Project/Area Number |
17K00060
|
Research Institution | Doshisha University |
Principal Investigator |
宿久 洋 同志社大学, 文化情報学部, 教授 (50244223)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 正準相関分析法 / 多次元尺度構成法 / 多ドメインマッチング法 / オープンデータ / 制約付き多変量解析法 |
Outline of Annual Research Achievements |
本研究では,情報源が複数存在するような非類似性データを想定して,新たな解析法の開発に取り組んでいる.特に,匿名化されたデータに対して適切な外部情報を付与して解析する多変量データ解析法の開発を行っている. 現在,大量のデータが自動的に収集蓄積されている状況にあるが,そのデータの活用は必ずしも順調なわけではない.自動的に収集されたデータの多くが個人情報を含んでおり,そのまま利用できないことが問題となっている.また,データの収集元が複数あり,そのデータの統合を考えた際に個人情報を保護しながら統一のデータプラットフォームを作るのは容易なことではない. このような問題意識を踏まえ,本研究においては,昨年度に引き続き,各変量の外部情報を用いた多変量解析手法の提案を行った.具体的には,カテゴリカルな外部情報を考慮した非対称多次元尺度構成法の提案,各種制約を取り入れた次元縮約とクラスタリング法の同時分析法の提案,外部情報を取り入れたUnfoldingの提案などを行った. これらは,上述のような秘匿された情報を用いることなく,データを融合する際の方法として利用可能なものになると考えている.本研究を進めることで一般的な場合における匿名化されたデータの外部情報を利用した多変量解析法の開発につながると考えている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では,上記実績の通り,いくつかのアプローチで複数の情報源を持つ非類似性データ,特に質的データについて,統計手法の提案に取り組んでいる. 本年度は,複数の情報源を持つデータ分析法の現状を把握し,想定されている大規模複雑類似性データ,分析法,分析結果の評価法について整理を行った.匿名化されたオープンデータからの知識発見に関して,そのニーズは大きく,統計科学の分野からのアプローチのみならず,情報科学の分野からのアプローチが数多く行われている.分析目的も多岐にわたっており,1つの方法論として体系化されていくかどうかは確定的ではない.今後も引き続き,調査していく必要があると考えられる.
|
Strategy for Future Research Activity |
複数の情報源を持つようなデータの分析方法,また,匿名化されたデータの分析方法については引き続き,調査を続けていきたいと考えている.それらを,統計科学の立場で位置づけ,体系化ができれば,今後の方法論の発展に寄与できると思われるので,引き続き取り組みたいと考えている. また,従来から,我々の研究グループも含め取り組んできた関連性データを切り口とした大規模複雑データの解析が複数の情報源からデータが得られたときどの程度有効であるのかについても検討を進めたいと考えている.その中で,いくつか新たな分析法の提案も行いたいと考えている. 令和元年度においては,これまでの研究を継続し,複数情報源非類似性データに対する分析法の総合的な調査,複数情報源非類似性データの新分析法の提案,提案手法の実装及びアルゴリズムの改良,実データに対する提案手法の適用を行い,新たな知見の獲得を目指す.加えて,いくつかの国際会議での発表を予定している.
|
Causes of Carryover |
当初予定していた国際会議への参加を見送ったため若干の残が発生した.最終年度は成果発表を目的として国際会議発表を予定しているので残はその分に充当したいと考えている.
|
Research Products
(8 results)