GPS等の測位機能で取得した緯度経度を持たず,本文に地名語を含むTwitterのデータを対象として,テキスト中の地名が,投稿者の現在位置(発信地)なのか,そうではないのか(関心地)を自動分類する手法を提案した.緯度経度と地名語の両者を持つデータを対象に,両者の距離に着目した分析を行い,教師データの作成を行った.実データを用いて有効性を評価した.加えて,再現率と精度のトレードオフという一般的な結果に加え,発信地と関心地とでこれらの値が逆転することや,広域スケールでは,発信地と比較して関心地が集中し,詳細スケールでは,関心地と比較して発信地が集中する,といった新たな知見を得た.
|