2011 Fiscal Year Annual Research Report
Project/Area Number |
21300034
|
Research Institution | Waseda University |
Principal Investigator |
岩井原 瑞穂 早稲田大学, 理工学術院, 教授 (40253538)
|
Keywords | データベース / コンテンツ / 構造化文書 / バージョン / セキュリティ |
Research Abstract |
ソーシャルメディアはブログやソーシャルネットワークサービス(SNS),wikiに代表される共同編集型コンテンツなどがあり,いずれも大量の情報が蓄積され,重要な情報基盤となりつつあり,コンテンツの時間的発展過程を考慮したマイニング手法の開発を行なった. 実時間ソーシャルメディアであるTwitterに関し,サッカーのワールドカップで記録されたツイートについて,ツイートの言語的複雑さ,記号の使用頻度,特定単語の出現などからなる素性を組み含わせた指標を定義し,それらがゴールなどの特徴的イベントやゲームの雰囲気とよく一致することを確かめた. Wikipediaの各記事の編集履歴に着目し,参加している編集者間の関係をネットワーク構造としてモデル化し,対立的な編集行動を行っている割合を示すrestoreratioという指標を求めた.この新たな指標と既存の指標を組み合わせ,記事の品質を評価することができる.実験結果により従来の手法よりも精度の良い評価結果が得られた.さらに,Wikipediaに蓄積されている記事の過去のバージョンから,バージョン間の派生関係を有向グラフとして復元する問題について,n-gramの頻度分布を比較するという効率的な手法を開発した. ソーシャルネットワーキングサービス(SNS)はだれがオンラインコンテンツにアクセスできるかのプライバシー設定を提供しているが,機能は単純化されているか複雑すぎるかに分かれがちである.Facebookの実ユーザ66,000人の設定のうちどの属性を一般に公開しているかの情報と,実験に参加したユーザが提供した設定をもとに,プライバシースコアと呼ばれる設定が開放的かどうかの指標を求める.これに加え,属性間の開示の共起確率による推薦や,スコアの分布の可視化など,有用な情報を提示することにより,ユーザのプライバシー設定を支援する手法を開発した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
Twitter, Wikipedia, Facebookといった代表的なソーシャルメディアにおいて,実データに基づく分析を行い良好な結果を得ている.
|
Strategy for Future Research Activity |
引き続きソーシャルメディアの分析手法の改良ならびにプロトタイプシステムの開発を行なうとともに,派生した新たな問題を定式化して解法を求めてゆく.
|
Research Products
(9 results)