モバイル端末を通して人々がマイクロブログにリアルタイムに発信する体験や意見はソーシャルビッグデータと呼ばれ,その有用性が注目されている.特に,新しい事物(固有表現)に関する情報はその分析価値が高いが,過去のデータを用いた静的な学習に基づく既存の自然言語処理技術ではこのような新情報を含むテキストの解析が難しい.
そこで本研究では,Wikipediaを利用した遠距離教師あり学習により多様な新固有表現をテキストストリームから動的に獲得する手法を開発した.また,獲得した知識を利用することを想定して,マイクロブログから大衆の価値観を獲得する手法や,機械翻訳,対話システムなどの研究も行った.
|