2012 Fiscal Year Research-status Report
階層付きモチーフ・パターン分析によるネットワークの類型化
Project/Area Number |
23500312
|
Research Institution | University of Shizuoka |
Principal Investigator |
大久保 誠也 静岡県立大学, 経営情報学部, 助教 (90422576)
|
Co-Investigator(Kenkyū-buntansha) |
武藤 伸明 静岡県立大学, 経営情報学部, 准教授 (40275102)
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
|
Keywords | ネットワーク類型化 |
Research Abstract |
本研究の目標は、1) 現実のネットワークデータの収集、ネットワークの階層を考慮した基本統計量の分析、ならびに適切なネットワーク生成モデルの構築。2) 階層付きモチーフ・パターンによるネットワーク類型化法の確立、ならびに人工ネットワークと現実ネットワークに対する計算機実験による評価。3) 時系列データに対する変化点の検出、および主要変化点の編纂に関する各種方法論の確立である。このうち、平成24年度は主に3を中心として実施した。そして、ブログやTwitter、レビューサイトの構造の比較を行った。 1) については、2011年3月8日から20日までのtwitterデータで欠けていた部分のデータを追加入手し、そこから Follow, Mention, Facorites という異なる繋がり方に着目したネットワークを生成し、分析ならびに比較を行った。加えて、本等に対する複数のレビューサイトデータと株価推移データを入手した。 2) については、twitter データに関して、ツイートのタイミングやユーザ集合を特徴量としてキーワードを類型化する手法を提案した。また、レビューサイトデータに対し、ユーザー間の類似度を定式化すると共に、どのように変化していくかについて、統計的な分析を行った。 3) については、時系列の変化点を検出する方法を複数提案するとともに、株価データやレビューサイトに対して適用することにより、妥当性の検討を行った。加えて、ユーザーがWレビューサイトにデータを投稿する行動のモデルを提案した。また、データが時間と共に拡散していく様子を効率的に可視化する方法を提案した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
目的1) については、平成23年度入手のデータに加えて、各種レビューサイト等のネットワークデータを追加で入手済みである。そして、これらのデータからより詳細な統計データを明らかにしている。今後、時系列データを元にしたネットワークモデルを構築する予定である。このことより、おおむね順調に進展していると考える。 目的2) については、ネットワークデータに対して、時系列データやユーザー集合を元にしたユーザーの類型化方法を提案している。今後、モチーフ等のさらなる特徴量を検討することにより、より妥当な類型化手法を提案する予定である。このことより、おおむね順調に進展していると考える。 目的3) については、時系列データの変化点を抽出する方法を複数提案するとともに、これらの手法をさまざまなデータに適用することにより妥当性を検討している。加えて、時系列に対するユーザーの行動モデルも提案している。今後、さらなる特徴量を検討することより妥当な変化点抽出手法を提案する予定である。このことより、おおむね順調に進展していると考える。 以上のことを総合的に判断し、おおむね順調に進展していると考える。
|
Strategy for Future Research Activity |
目的1) については、 引き続き、基本統計量の解析を進める。また、モチーフパターンならびに階層付きモチーフパターンを用いた解析を行う。特に、時系列データに対して、モチーフパターン数や各種統計量の変化を調べることにより、個々のノードがどのように結線されていくかを明らかとする。これらの結果より、ネットワークがどのように成長するのかの詳細を明らかとすると共に、妥当な生成モデルを提案する。 目的2) については、モチーフパターンによる解析を実施することにより、その有効性を検証する。加えて、人工ネットワークを生成し、そのネットワークにノードやリンク群のランダムな削除や入替を施すことにより、不完全なネットワークでの類型化能力を定量的に評価する。これらの結果より、モチーフ・パターンの基本能力やネットワーク類型化法の頑健性を明らかにする。 目的3) については、引き続き、ネットワークの時系列データに関する類型化法を検討し、その方法を用いたネットワーク構造の主要な変化点の検出法の確立を目指す。具体的検証のため、レビューサイトや株価データ、ウェブサイト等の各種ネットワークデータに提案手法を用いることで、その有効性を確認する。
|
Expenditure Plans for the Next FY Research Funding |
本研究で想定している計算機実験、特にネットワークからの階層付きモチーフの抽出および統計量の分析には、大きなCPUパワーとメモリが必要である。これらの実験を並列に進行させ、研究の進捗を加速させるために、複数のマルチコアCPUと大容量のメモリを備えた高性能計算機を購入する。 研究代表者および2名の研究分担者は、タイムリーかつ効果的に研究成果の情報発信を行うために、各々が積極的に国内外での研究発表を行う。具体的には、年2件の国内研究発表、年1件の国際会議発表、年1件の論文発表とする。そのための旅費ならびに参加費を計上する。
|
Research Products
(13 results)