• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実施状況報告書

大規模複雑関連性データの解析法に関する総合的研究

研究課題

研究課題/領域番号 24500352
研究種目

基盤研究(C)

研究機関同志社大学

研究代表者

宿久 洋  同志社大学, 文化情報学部, 教授 (50244223)

研究分担者 深川 大路  同志社大学, 文化情報学部, 助教 (10442518)
波多野 賢治  同志社大学, 文化情報学部, 准教授 (80314532)
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワードビッグデータ / シンボリックデータ / 多次元尺度構成法 / クラスタリング
研究概要

関連性データは,2者関係について記述したデータである.例えば,心理学では実験課題として2つの刺激の関連性を判断して得られたり,社会学では世代間の職業移動や地域間の移住の件数を集計することで得られたり,社会心理学では集団の成員間の親近性を測定することで得られる.そして,このようにして得られた類似性データの行列を用いて,どの対象が似ているか,または似ていないかを明らかにし,対象間の関係,あるいはその中に存在する構造について探ることが分析の主題となる.
本研究ではまず,既出の研究の中で想定されていた大規模複雑類似性テータの記述やこれらのデータがもつ数学的性質,それらに対する分析法に関して,統計科学分野のみでなく,連携研究者と協力して情報科学分野からも文献の収集を行い,想定したデータに対して用いている分析法や,分析の問題点について整理している.複数の分野にわたり調査する理由として,大規模複雑類似性テータの分析が, 統計科学の分野では,シンボリックデータ解析によるデータの記述の拡張とそれらの分析法が多く存在し,情報科学の分野では,機械学習やデータマイニングによる知識獲得の手法が数多く存在しているが,これらの分野間の連携が十分ではないために同一の分析目的に対して提案されている分析法が把握できていないという問題があるためである.
本年度は,典型的な大規模複雑データであるPOSデータおよび時系列データについて,新たな類似度の提案を行い,その類似度を利用したいくつかの多次元尺度構成法およびクラスタリング法の提案を行った.主なアプローチ法は次の4つであり,これらを用いた手法の提案を行った.
1)データ標準化の利用,2)非対称な非類似度の利用,3)多相データへの適用,4)部分空間の利用

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究では,上記実績の通り,いくつかのアプローチで大規模複雑データについて,特に,非類似度を利用する統計手法の提案に取り組んでいる.本年度は,大規模複雑類似性データ分析の現状を把握し,想定されている大規模複雑類似性データ,分析法,分析結果の評価法について整理を行った.ビッグデータ解析に関するニーズは大きく,統計科学の分野からのアプローチのみならず,情報科学の分野からのアプローチが数多く行われている.分析目的も多岐にわたっており,1つの方法論として体系化されていくかどうかは確定的ではない.今後も引き続き,調査していく必要があると考えている.

今後の研究の推進方策

既存および日々提案されているビッグデータ解析に関する方法論については,できる限り,調査していきたいと考えている.それらを,統計科学の立場で位置づけ,体系化ができれば,今後の方法論の発展に寄与できると思われるので,引き続き取り組みたいと考えている.
また,従来より,我々の研究グループも含め取り組んできた関連性データを切り口としたデータ解析が大規模複雑データの解析に対して,どの程度有用であるのかについても検討を進めたいと考えている.その中で,いくつか新たな分析法の提案も行いたいと考えている.

次年度の研究費の使用計画

平成25年度においては,24年度に引き続き,大規模複雑類似性データに対する分析法の総合的な調査,大規模複雑類似性データの新分析法の提案,提案手法の実装及びアルゴリズムの改良,実データに対する提案手法の適用を行い,新たな知見の獲得を目指す.加えて,既にいくつかの国際会議での発表が受理されている.具体的には,次の3つの関連分野の国際会議において,本科研のテーマの発表を予定している.
European Conference on Data Analysis
The 2013 conference of the International Federation of Classification Societies
International Meeting Psychometric Society 2013
本年度は,これらの国際会議への参加旅費を中心に研究費を使用することを計画している.

  • 研究成果

    (5件)

すべて 2012

すべて 雑誌論文 (5件) (うち査読あり 5件)

  • [雑誌論文] A Retrieval method based on language model considering neighboring contents2012

    • 著者名/発表者名
      Tamura, K., Hatano, K. and Yadohisa, H.
    • 雑誌名

      Journal of Digital Information Management

      巻: 10 ページ: 1-9

    • 査読あり
  • [雑誌論文] Effect of data standardization on the result of k-means clustering2012

    • 著者名/発表者名
      Tanioka, K. and Yadohisa, H.
    • 雑誌名

      Challenges at the interface of Data Analysis, ComputerScience, and Optimization, Springer, Heidelbarg

      巻: - ページ: 151-159

    • 査読あり
  • [雑誌論文] Three-way asymmetric hierarchical clustering based on regularized similarity model2012

    • 著者名/発表者名
      Tanioka, K. and Yadohisa, H.
    • 雑誌名

      COMPSTAT 2012: Proceedings in Computational Statistics, Limassol, Cyprus.

      巻: - ページ: 789-800

    • 査読あり
  • [雑誌論文] An overlapping clustering method for signed graphs2012

    • 著者名/発表者名
      Kitano, M. and Yadohisa, H.
    • 雑誌名

      COMPSTAT 2012: Proceedings in Computational Statistics, Limassol, Cyprus.

      巻: - ページ: 391-402

    • 査読あり
  • [雑誌論文] Subspace hierarchical clustering for three-way three-mode data using quadratic regularization2012

    • 著者名/発表者名
      Tanioka, K. and Yadohisa, H.
    • 雑誌名

      Procedia Computer Science

      巻: 12 ページ: 248-253

    • 査読あり

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi