2012 Fiscal Year Annual Research Report
Project/Area Number |
21300034
|
Research Institution | Waseda University |
Principal Investigator |
岩井原 瑞穂 早稲田大学, 理工学術院, 教授 (40253538)
|
Project Period (FY) |
2009-04-01 – 2013-03-31
|
Keywords | データベース / コンテンツ / ソーシャルメディア / 構造化文書 / セキュリティ / プライバシー |
Research Abstract |
本研究はソーシャルネットワークサービス(SNS)やWikiに代表されるソーシャルコンテンツから有用な情報を抽出する技術の開発を目的とする.wiki型コンテンツは多人数が1つの記事を更新することにより,バージョンが蓄積されるが,その派生過程を正確に求める手法を開発した.またSNSにおいて利用者が行うプライバシー設定の傾向を分析し,適切な設定を推薦する手法を開発した.さらにコンテンツのアクセス制御について効率的な手法の開発を行った. Wikipediaの編集履歴は,差分を繰り返し求めて依存関係を把握する必要がある.バージョンの依存関係・意味的関係を表すバージョングラフの再構成が必要であるが,(a)従来の文書の差分アルゴリズムは2つの文書間であるためバージョングラフの再構成には計算コストがかかりすぎること,(b)単に編集距離が最短のものを親バージョンとしても正しい結果が得られず,また人間にとって理解の難しい不自然な差分を生成するという問題点がある.これまで編集履歴の可視化や,編集過程での協調行動の分析,編集回数等を用いた記事の品質評価などの研究があるが,いずれも正確なバージョングラフに基づいていない. 本研究では,Wikipediaに蓄積されている記事の過去のバージョンから,バージョン間の派生関係を有向グラフとして復元する問題について,n-gramの頻度分布を比較するという効率的な手法を開発した.さらに,常に連続して出現するn-gram同志をひとつにまとめる操作により,さらに精度を改善できることを示している. また,ソーシャルネットワークサービス(SNS)において,利用者がコンテンツの共有範囲を設定する,プライバシー設定について,コンテンツ公開状況を多数の利用者について求めて傾向を分析し,その結果をもとに利用者に適切なプライバシー設定を推薦する手法について,改良を行った.
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
Research Products
(3 results)