2012 Fiscal Year Research-status Report
Project/Area Number |
24653131
|
Research Category |
Grant-in-Aid for Challenging Exploratory Research
|
Research Institution | Kansai University |
Principal Investigator |
安田 雪 関西大学, 社会学部, 教授 (00267379)
|
Co-Investigator(Kenkyū-buntansha) |
鳥海 不二夫 東京大学, 工学(系)研究科(研究院), 准教授 (30377775)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | ソーシャルメディア / ネットワーク分析 / 民意推定 |
Research Abstract |
今年度は、データ収集システムの構築と試行、試行収集データの内容分析とソーシャルメディア上の情報拡散に関わる事例の実証分析を行い、国内の学会及び研究会における報告を多数行なった。ソーシャルメディアからの民意抽出にむけての基礎資料となる分析を行なった。 具体的には、(1)関西大学安田研究室における中規模なtweetデータの収集システムの構築と試行データの収集、東京大学鳥海研究室における大規模なtweetデータの安定的収集システムの構築と試行データの収集、(2)中規模及び大規模tweetデータの収集事例分析に関する学会及び研究会報告、(3)ソーシャルメディア固有の情報拡散過程についての理論的検討を行った。 (1)についてはソーシャルメディアの諸特性を検討したうえで、ブログなどの他のソーシャルメディアについてはIT事業者などが効率的な収集システムを商用化していることをふまえ、twitter上に発散されるtweetデータの収集を可能とするシステムを構築することとした。そのうえで、突発的に生じる事件をも含め時事問題や、爆発的流行現象に関するソーシャルメディア上の言論を分析対象にするため、365日24時間の突発的なデータ収集要求に対応が可能になるよう、大規模、中小規模、双方のデータを機動的に収集できる体制を代表者と分担者の二拠点に構築した。(2)については、コスモ石油火災に関するデマ及びデマ否定tweetの大規模データセットを分析し、そこからの知見についての報告を、日本社会学会、ソーシャルメディアシンポジウムなどで、ソーシャルメディア上のデマ及びデマ拡散にみられる普遍的法則についての報告を行っている。鳥海分担者とともにSoc12、JWEIN、SMWSなどの研究会にはともに参加し、別途報告を行っている。(3)は今後の民意推定方法の確立にむけての理論的基礎研究として行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
達成は、大きく以下の四点にまとめられる。(1)ソーシャルメディア上に拡散する大量データの収集システムの構築、(2)同システムで収集した衆議院選挙関連データ、流行現象に関する複数のデータ内容解析(複数のテキストマイニングツールを比較するとともに視認もしつつ行っている)、(3)解析ツール(見える可エンジン、TTM、Rなど、入手可能なテキストマイニングツール)の分析機能の比較・効率及び費用対効果の検討、(4)試行収集データの分析に基づく民意推定のための理論研究の実施。 具体的には、大規模tweetを収拾しうるソーシャルメディアの効率的収集システムを構築し、2012年度に実データとして収集したもので最も大きいものは2012年の衆議院選挙前二週間分の大量tweetデータ(プレインテキストデータで3.5Gb)である。鳥海研究室で大規模データ分析に必要な設備をほぼ備え、文系の安田研究室でも中規模データの読取及び加工操作に必要な設備やシステムを構築できたことは、ほぼ当初の計画どおりの達成と考えている。現在、このデータを細分化、部分抽出し、テキストマイニングを行っている。テキストマイニングでは、視認にくわえて、時系列による情報内容の傾向分析、特徴語の抽出、民意推定に用いるキーワードタグと、キーワード同士の関連の検討を元データからのサンプリングをして実行しており、システムの安定的な稼働状態を保てており、これも当初の目標に達していると考えている。また、衆議院選挙に関するtweetデータ以外にも、短期的流行現象とソーシャルメディア上の情報流通量及び頻度、分布に関する検討を行うため、時事ニュース、映画、ベストセラー、新商品の開発などの社会現象に関する実験的な小規模tweetデータの収集を行った。これらの内容分析は順当だが、今後は民意推定のアルゴリズムや手法の検討という次年度の課題が残っている。
|
Strategy for Future Research Activity |
過年度と同様に、関西大学安田研究室と東京大学鳥海研究室と連携をとりながら進めていく予定である。今年度は衆議院議員選挙のデータ分析にもとづき、参議院選挙のtweetデータの収集と分析、そこからの特徴量抽出と民意推定に注力する予定である。 2010年から11年は、震災後の復興や、選挙などが、多様なソーシャルメディア及び利用者が独自にその機能や可能性を追求し始める契機となったため、twitter以外のソーシャルメディアの動向や利用状況についても観察と研究を進める予定である。もちろん、ソーシャルメディアのみならず既存の伝統的なマスメディア上の報道情報を収集し、民意形成の関係についての補助的資料として用いていきたいと考えている。 また、全体の俯瞰図を誰も得られない状況で、マスコミからの情報、第一次ソースによる局地的な情報を、マスコミのみならず市民らがソーシャルメディアなどを経由して時間軸・空間軸を超えて拡散させた事例である東日本大震災時のデータアーカイブについても研究を進めるものとする。現段階は、マスコミが情報の集約機能を果たしきれないなか、市民の集合知による状況把握と伝播の試みがなされた画期的な数年間だと解釈しうるため、注意深く複数テーマのデータセットを収集し、ネット以外の他メディアにおける民意とのずれ、差分などを丁寧に追求してく予定である。差分の追求以外にも情報のS/N比の検討も同時に行っていきたい。 なお、データの収集と解析期間が長期に及ぶことが予測されるため、研究代表者のみならず、鳥海、安田、両研究室に所属する大学院生相互のコラボレーションをより緊密にしていく必要があると考えている。
|
Expenditure Plans for the Next FY Research Funding |
次年度は、流行現象や社会状況に関するソーシャルメディア上のデータ収集を繰り返し行う計画であるが、なかでも、参議院選挙に関するtweetデータの収集を投票日前に集中して行う予定である。時期が限定されているため、集中的に投票日前の一定期間、tweetデータを収集する予定である。 さらに流行現象、時事問題や噂などのtweetも、逐次的に収集、分析事例として蓄積していく予定である。中規模データの収集tweetデータの総量が膨大になることが予測されるため、さらに大容量保存可能なHDや分析に耐えるメモリを備えたマシンの購入も検討している。また、クロスメディア効果を検討するためには、これらのtweetデータの内容が、新聞・テレビなどマスメディアも含め、各種メディアが供給する情報の内容と量との対応関係を調査することを検討しているため、大量のデータ保存媒体が必要となる。選挙データの録画及び再生機能の最新メディア機器及びデータ保存用メディアの種類と費用対効果を現在、検討している。 また今年度までは、学会及び研究会報告が比較的、国内に限定されてきたため、SUNBELT(International Network for the Social Network Analysis)などの国際学会をはじめ、国際的な研究会での報告を積極的に行う予定である。
|