知識蓄積型ソーシャルメディアであるWikipediaからは,計算機利用が容易な構造的データが知識グラフとして抽出され,検索結果の分類や種々の自然言語処理に活用されている.知識グラフを充実させるためのWikipedia記事のマイニングにおいて,リンクやリストなどの構造情報を活用し,さらに拡張する手法が必要である. 本研究では,Wikipediaにおいて,併合すべき記事対の予測および新たなリンクを予測する手法を開発した.テキストからのキーフレーズ抽出について,訓練済み言語モデルを用いた手法を開発し従来を上回る精度を示した.センチメント分析を応用したツィートの著者推定を行う手法を開発した.
|