研究概要 |
ソーシャルメディアはブログやソーシャルネットワークサービス(SNS),wikiに代表される共同編集型コンテンツなどがあり,いずれも大量の情報が蓄積され,重要な情報基盤となりつつあり,コンテンツの時間的発展過程を考慮したマイニング手法の開発を行なった. 実時間ソーシャルメディアであるTwitterに関し,サッカーのワールドカップで記録されたツイートについて,ツイートの言語的複雑さ,記号の使用頻度,特定単語の出現などからなる素性を組み含わせた指標を定義し,それらがゴールなどの特徴的イベントやゲームの雰囲気とよく一致することを確かめた. Wikipediaの各記事の編集履歴に着目し,参加している編集者間の関係をネットワーク構造としてモデル化し,対立的な編集行動を行っている割合を示すrestoreratioという指標を求めた.この新たな指標と既存の指標を組み合わせ,記事の品質を評価することができる.実験結果により従来の手法よりも精度の良い評価結果が得られた.さらに,Wikipediaに蓄積されている記事の過去のバージョンから,バージョン間の派生関係を有向グラフとして復元する問題について,n-gramの頻度分布を比較するという効率的な手法を開発した. ソーシャルネットワーキングサービス(SNS)はだれがオンラインコンテンツにアクセスできるかのプライバシー設定を提供しているが,機能は単純化されているか複雑すぎるかに分かれがちである.Facebookの実ユーザ66,000人の設定のうちどの属性を一般に公開しているかの情報と,実験に参加したユーザが提供した設定をもとに,プライバシースコアと呼ばれる設定が開放的かどうかの指標を求める.これに加え,属性間の開示の共起確率による推薦や,スコアの分布の可視化など,有用な情報を提示することにより,ユーザのプライバシー設定を支援する手法を開発した.
|