研究課題/領域番号 |
23500312
|
研究機関 | 静岡県立大学 |
研究代表者 |
大久保 誠也 静岡県立大学, 経営情報学部, 助教 (90422576)
|
研究分担者 |
武藤 伸明 静岡県立大学, 経営情報学部, 准教授 (40275102)
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | ネットワーク類型化 |
研究概要 |
本研究の目標は、1) 現実のネットワークデータの収集、ネットワークの階層を考慮した基本統計量の分析、ならびに適切なネットワーク生成モデルの構築。2) 階層付きモチーフ・パターンによるネットワーク類型化法の確立、ならびに人工ネットワークと現実ネットワークに対する計算機実験による評価。3) 時系列データに対する変化点の検出、および主要変化点の編纂に関する各種方法論の確立である。このうち、平成23年度は主に1と2を実施した。1) については、ネットワークデータの拡充をするため、国立国会図書館から国立大学のWebサイトデータを各大学3~5年分、あわせて350件ほど入手した。そして、それらのWebサイトデータからネットワークデータへの変換を行った。また、2011年3月8日から20日のあいだのtwitterデータも入手した。これらのデータに対して、ネットワークモチーフ数や連結成分数、次数分布等を評価することにより、ネットワーク構成を特徴付けるいくつかの重要な基本統計量を明らかとした。さらに、これらのネットワークが時間と共にどのように成長したのか、Gini係数を評価することにより解析した。これらの結果により、ネットワーク生成モデル構築に必要となる、ネットワーク構造ならびに成長過程の特徴が明らかとななりつつある。2) については、入手した各種ネットワークデータに対して、妥当な階層付け方法の検討を行った。また、3)について年度を繰り上げて実施した。まず、尤度比検定を用いた新しい変化点抽出手法を提案した。そして、価格.com ならびに @COSMEの各オンラインレビューサイトの時系列データに対して提案手法を適用することで、その妥当性を検討した。その結果、明らかに異常な評点行動をとっているユーザーや、時事的な原因による商品の評価変動、及び評価の変化点を検出することに成功した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
目的1) については、現在、各種ネットワークデータが入手済みであり、またいくつかの統計データを明らかにしている。平成24年度中に、これらのデータを元にした生成モデルを構築する予定である。このことより、おおむね順調に進展していると考える。目的2) については、入手した各種ネットワークデータに対して、妥当な階層付けの方法の検討を実施している。今後、各種実験を行うことにより、提案手法である階層付きモチーフ・パターン分析の有効性を明らかとする予定である。このことより、おおむね順調に進展していると考える。目的3) については、当初は平成24年度から実施巣津予定であったが、すでにある程度の結果が出始めている。したがって、当初の計画以上に進展していると考える。以上のことを総合的に判断し、おおむね順調に進展していると考える。
|
今後の研究の推進方策 |
目的1) については、 引き続き、基本統計量の解析を進める。また、モチーフパターンならびに階層付きモチーフパターンを用いた解析を行う。特に、時系列データに対して、モチーフパターン数の変化を調べることにより、個々のノードがどのように結線されていくかを明らかとする。これらの結果より、ネットワークがどのように成長するのかの詳細を明らかとすると共に、妥当な生成モデルを提案する。目的2) については、平成23年度に検討した階層付けを実施する。そして、階層付きモチーフパターンによる解析を実施することにより、その有効性を検証する。加えて、人工ネットワークを生成し、そのネットワークにノードやリンク群のランダムな削除や入替を施すことにより、不完全なネットワークでの類型化能力を定量的に評価する。これらの結果より、階層付きモチーフ・パターンの基本能力やネットワーク類型化法の頑健性を明らかにする。目的3) については、引き続き、ネットワークの時系列データに関する類型化法を検討し、その方法を用いたネットワーク構造の主要な変化点の検出法の確立を目指す。具体的検証のため、ウェブサイトの設計原理やネットワークの時系列データ等の各種データに提案手法を用いることで、その有効性を確認する。また、変化点を自動編纂する方法論の構築も目指す。
|
次年度の研究費の使用計画 |
本研究で想定している計算機実験、特にネットワークからの階層付きモチーフの抽出および統計量の分析には、大きなCPUパワーとメモリが必要である。これらの実験を並列に進行させ、研究の進捗を加速させるために、複数のマルチコアCPUと大容量のメモリを備えた高性能計算機を購入する。また、膨大なデータを保存するため、平成23年度にタイの洪水の影響で購入できなかった大容量ハードディスクドライブを複数台搭載した計算機を購入する。研究代表者および2名の研究分担者は、タイムリーかつ効果的に研究成果の情報発信を行うために、各々が積極的に国内外での研究発表を行う。具体的には、年2件の国内研究発表、年1件の国際会議発表、年1件の論文発表とする。そのための旅費ならびに参加費を計上する。
|