2016 Fiscal Year Research-status Report
マイクロブログからのユーザ適応型実世界観測情報検索システムの構築
Project/Area Number |
26330137
|
Research Institution | Osaka University |
Principal Investigator |
新田 直子 大阪大学, 工学研究科, 准教授 (00379132)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | マイクロブログ / 実世界センシング / ソーシャルセンサ / 地域情報 / ユーザ適応 / 情報検索 |
Outline of Annual Research Achievements |
本研究は,Twitterに代表されるマイクロブログには,世界中の人間からリアルタイムな実世界観測情報が投稿されることに着目し,個々のユーザの現在地及び関心に応じて,マイクロブログから適切な実世界観測情報を抽出するシステムの構築を目指す.今年度は以下の課題に取り組んだ. ・ローカル語の抽出・更新 投稿位置の緯度・経度を表すジオタグ付き投稿から,局所的に使用される単語をローカル語として抽出することができる.これらのローカル語の中には,定常的なものと一時的なものが存在する.そこで,ローカル語の示す位置の時間的一貫性に基づき,定常語と非定常語に分類しながら,定常語を逐次的に増加させると共に,非定常語の追加,削除,位置の更新を行う手法を提案した. ・実世界観測情報の抽出 上記で抽出したローカル語は実世界の様々な観測対象を表す語であり,ローカル語が表す対象の観測情報の一部として,ローカル語が示す位置の周辺からのローカル語を含む投稿が収集できる.しかし,実世界観測情報にはローカル語を含まないものも多く存在する.そこで,これらの実世界観測情報を抽出するため,以下のような手法を提案した.まず,各対象の観測情報には,その対象の特徴を表す単語が含まれると期待される.そこで,すべてのローカル語に対して収集した観測情報から,同じようなコンテキストで用いられる単語間の類似度が高くなるよう単語の意味表現(ベクトル)を学習する.これにより観測情報に含まれる単語の意味表現から,ローカル語の意味が規定でき,ローカル語をクエリとして考えたとき,ローカル語を含むか含まないかに関わらず,意味的に関連する実世界観測情報が抽出できる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度の二つの課題に対し,以下のように提案手法の有用性を評価した. ・ローカル語の抽出・更新 提案手法はローカル語と共に,ローカル語が示す位置,ローカル語が示す対象の観測対象と考えられる投稿(テキスト及び画像)を抽出する.ローカル語に基づく投稿の位置推定,及び画像認識を応用例として,抽出した情報の正しさ,及び提案手法におけるパラメータの影響を検証した.実際に連続した30日間の投稿から逐次的に抽出したローカル語は,クラウドソーシング(人手)により作成された地名辞書と比較し,約2%程度のローカル語を用いて,2倍の投稿に対し,また既存手法と比較しても2倍程度のローカル語で,1.3倍の投稿に対し正しく位置推定できた.特に定常語のみを用いたとき,位置推定精度が向上することから,信頼性の高いローカル語が定常語として抽出されたことが分かった.また,非定常語に対して抽出された画像を事例として用い,周辺から投稿された画像に対する認識を行った結果,再現率,適合率共に70%程度で正しく非定常語が表すイベントが正しく認識されたことから,定常語,非定常語共に,おおむね正しい情報が抽出されたと考えられる. ・実世界観測情報の抽出 上記で抽出したローカル語に対して意味表現を算出し,ローカル語を含まない観測情報が正しく抽出されるか検証した.ローカル語を含む観測情報によりある程度意味内容が推測できる対象に対しては,ローカル語を含まない観測情報が上位に抽出されることが示された.ただし,同じ位置から異なるアカウント名で同様の内容を投稿するボットの存在が抽出結果に大きく影響することが分かった.これらのボットはローカル語の誤検出とも関係するため,今後対策が必要である. 以上のように,両課題について手法がほぼ完成すると共に,改良点も明らかとなり,おおむね順調に進展していると考える.
|
Strategy for Future Research Activity |
まず,今年度までに明らかとなったボットによる投稿の自動除去処理の追加による,ローカル語,及び実世界観測情報の抽出精度の向上が第一課題となる.その後,今年度までに開発した要素技術を統合したプロトタイプシステムを構築する.特に,ユーザの現在地や関心に応じて抽出された実世界情報を分かりやすくまとめて提示するインタフェースを作成し,実際にユーザの状況を変更した際の提示結果に基づきシステムのユーザ適応性を評価し,問題点を整理する予定である.
|
Causes of Carryover |
今年度に参加を予定していた学会を次年度の学会参加に変更したため.
|
Expenditure Plan for Carryover Budget |
今年度4月に開催される国際会議への参加費用として使用する予定である.
|