研究課題/領域番号 |
25330362
|
研究種目 |
基盤研究(C)
|
研究機関 | 東京工業大学 |
研究代表者 |
野呂 智哉 東京工業大学, 情報理工学(系)研究科, 助教 (80401553)
|
研究分担者 |
徳田 雄洋 東京工業大学, 情報理工学(系)研究科, 教授 (30111644)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | ソーシャルメディア / マイクロブログ / 推薦 / マイニング / オントロジー |
研究概要 |
リツイートやリプライにもとづくユーザ・ツイート間の関係とWikipedia等の外部情報を利用し,興味のある話題に関連するTwitter上のユーザを発見する手法の研究を行った.本手法は,ユーザ・ツイート間の関係を利用して影響力のあるユーザを候補として獲得する第一段階と,外部情報を利用して発信する話題の時間的一貫性のあるユーザを,第一段階で獲得した候補の中から選択する第二段階の2つからなる. 第一段階では,興味のある話題に関連するキーワードを入力とし,それに適合するツイート集合から,リツイートやリプライに関するユーザ・ツイート間の関係を取り出し,参照グラフを作成する.それをもとに各ユーザの影響力を算出し,各ユーザが発信したツイート数と組み合わせることによって順位付けを行う. 第二段階では,第一段階で上位に順位付けされたユーザを対象とし,各ユーザが発信するツイートの内容を複数期間に分けて観測する.Wikipediaをもとに作られたDBpediaを外部情報として各ツイートから固有表現を抽出し,YAGOオントロジーをもとに分類を行って,各観測期間において各ユーザが発信する話題を抽出する.それをもとに,各ユーザが発信する話題の時間的一貫性を計算し,スコアが閾値以上のユーザを最終的に関連ユーザとして提示する. 4種類の英語キーワードを利用して収集した英語ツイートを利用して評価実験を行い,本手法により検索精度が向上することを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の予定通りに進んでおり,既に次の段階に着手している.
|
今後の研究の推進方策 |
当初の計画を踏まえた上で,大きく3つのテーマに分けて研究を進める. 1つ目は,外部情報としてニュース記事を利用し,Twitter内部のハッシュタグと組み合わせることによって興味のある話題に関連するユーザを発見する手法の研究である.興味のある話題を表すキーワードを入力としニュース記事集合において特徴的に共起する語を獲得する.一方,ツイート中の各ハッシュタグについてそれと特徴的に共起する語を獲得し,先に獲得したニュース記事中の共起語集合との類似度を計算することによってニュースの話題に関連するハッシュタグを発見し,それをもとに話題ごとのコミュニティを検出する.そのコミュニティに所属するユーザについて影響力を算出し,関連ユーザを発見する. 2つ目は,外部情報としてWikipediaやオントロジーを利用して関連ユーザを発見する手法の研究である.Wikipediaやオントロジーを利用し,各ユーザのツイート内容からそのユーザの興味を解析し,共通の興味を持つユーザのコミュニティを検出することにより,関連ユーザを発見する. 3つ目は,Twitter上での行動の特徴を利用して関連ユーザを発見する手法の研究である.ツイートの頻度や内容,他ユーザとの関わり方等をもとにユーザを分類し,それをもとに関連ユーザを発見する.また,従来研究では,ユーザの影響力を測定する目的でフォロー関係を利用することは適切ではないと言われているが,リツイートやリプライの関係等,他の情報と組み合わせて統合的に解析する手法を開発し,検索精度の向上を目指す.
|