研究課題/領域番号 |
24500352
|
研究種目 |
基盤研究(C)
|
研究機関 | 同志社大学 |
研究代表者 |
宿久 洋 同志社大学, 文化情報学部, 教授 (50244223)
|
研究分担者 |
深川 大路 同志社大学, 文化情報学部, 助教 (10442518)
波多野 賢治 同志社大学, 文化情報学部, 准教授 (80314532)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | ビッグデータ / シンボリックデータ / 多次元尺度構成法 / クラスタリング |
研究概要 |
関連性データは,2者関係について記述したデータである.例えば,心理学では実験課題として2つの刺激の関連性を判断して得られたり,社会学では世代間の職業移動や地域間の移住の件数を集計することで得られたり,社会心理学では集団の成員間の親近性を測定することで得られる.そして,このようにして得られた類似性データの行列を用いて,どの対象が似ているか,または似ていないかを明らかにし,対象間の関係,あるいはその中に存在する構造について探ることが分析の主題となる. 本研究ではまず,既出の研究の中で想定されていた大規模複雑類似性テータの記述やこれらのデータがもつ数学的性質,それらに対する分析法に関して,統計科学分野のみでなく,連携研究者と協力して情報科学分野からも文献の収集を行い,想定したデータに対して用いている分析法や,分析の問題点について整理している.複数の分野にわたり調査する理由として,大規模複雑類似性テータの分析が, 統計科学の分野では,シンボリックデータ解析によるデータの記述の拡張とそれらの分析法が多く存在し,情報科学の分野では,機械学習やデータマイニングによる知識獲得の手法が数多く存在しているが,これらの分野間の連携が十分ではないために同一の分析目的に対して提案されている分析法が把握できていないという問題があるためである. 本年度は,典型的な大規模複雑データであるPOSデータおよび時系列データについて,新たな類似度の提案を行い,その類似度を利用したいくつかの多次元尺度構成法およびクラスタリング法の提案を行った.主なアプローチ法は次の4つであり,これらを用いた手法の提案を行った. 1)データ標準化の利用,2)非対称な非類似度の利用,3)多相データへの適用,4)部分空間の利用
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では,上記実績の通り,いくつかのアプローチで大規模複雑データについて,特に,非類似度を利用する統計手法の提案に取り組んでいる.本年度は,大規模複雑類似性データ分析の現状を把握し,想定されている大規模複雑類似性データ,分析法,分析結果の評価法について整理を行った.ビッグデータ解析に関するニーズは大きく,統計科学の分野からのアプローチのみならず,情報科学の分野からのアプローチが数多く行われている.分析目的も多岐にわたっており,1つの方法論として体系化されていくかどうかは確定的ではない.今後も引き続き,調査していく必要があると考えている.
|
今後の研究の推進方策 |
既存および日々提案されているビッグデータ解析に関する方法論については,できる限り,調査していきたいと考えている.それらを,統計科学の立場で位置づけ,体系化ができれば,今後の方法論の発展に寄与できると思われるので,引き続き取り組みたいと考えている. また,従来より,我々の研究グループも含め取り組んできた関連性データを切り口としたデータ解析が大規模複雑データの解析に対して,どの程度有用であるのかについても検討を進めたいと考えている.その中で,いくつか新たな分析法の提案も行いたいと考えている.
|
次年度の研究費の使用計画 |
平成25年度においては,24年度に引き続き,大規模複雑類似性データに対する分析法の総合的な調査,大規模複雑類似性データの新分析法の提案,提案手法の実装及びアルゴリズムの改良,実データに対する提案手法の適用を行い,新たな知見の獲得を目指す.加えて,既にいくつかの国際会議での発表が受理されている.具体的には,次の3つの関連分野の国際会議において,本科研のテーマの発表を予定している. European Conference on Data Analysis The 2013 conference of the International Federation of Classification Societies International Meeting Psychometric Society 2013 本年度は,これらの国際会議への参加旅費を中心に研究費を使用することを計画している.
|