2015 Fiscal Year Research-status Report
マイクロブログからのユーザ適応型実世界観測情報検索システムの構築
Project/Area Number |
26330137
|
Research Institution | Osaka University |
Principal Investigator |
新田 直子 大阪大学, 工学(系)研究科(研究院), 講師 (00379132)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | マイクロブログ / 実世界センシング / ソーシャルセンサ / ユーザ適応 / 位置推定 / テキスト検索 |
Outline of Annual Research Achievements |
本研究は,Twitterに代表されるマイクロブログには,世界中の人間のリアルタイムな実世界観測情報が投稿されることに着目し,個々のユーザの現在地及び関心に応じて,マイクロブログから適切な実世界観測情報を抽出するシステムの構築を目指す.今年度は以下の課題に取り組んだ. ・ローカル語の更新 マイクロブログには投稿位置の緯度・経度をジオタグとして付与することができるため,ジオタグ付き投稿から,局所的に使用される単語をローカル語として抽出することができる.ただしローカル語には,イベントを表す単語など,示す場所が動的に変化するものが含まれる.そこで,単語の使用位置の現在の局所性の高低に基づくローカル語の追加・削除,及びローカル語の示す位置の更新からなる逐次的な学習方法を考案した. ・単語間関連度の更新及び実世界観測情報抽出手法の改良 ユーザの関心がクエリとして与えられる単語で表されるものとするとき,各投稿がユーザの関心に合致するか否かは,投稿に含まれる単語のクエリに対する関連度に依存すると考えられる.ただし,単語間の意味的な関連度は時節やイベントの発生などに応じて変化し得る.本研究では,単一の投稿中に共起する単語ほど意味的な関連度が強いと考え,単語対の同一投稿中の共起に基づき,関連度を逐次的に学習する手法を考案した.また,ユーザの関心を表す任意のクエリに対し,各投稿をクエリに対する関連度分布で表し,単一の2クラス分類器を用いてクエリに応じた実世界観測情報抽出及びクエリに対する関連スコアの算出を実現した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
今年度の二つの課題に対し,以下のように提案するアイデアの有効性を評価した. ・ローカル語の更新 実際に連続した10日間に投稿された約270万件の投稿すべてから従来手法によりローカル語を抽出した場合と比較し,提案手法により初日から逐次的にローカル語を学習した場合,5日後には同等数,30日後には6.5倍のローカル語が抽出された.また,30日間の投稿に対し位置推定を行った結果,従来手法と比べて約20%多くの投稿に対し,平均で53%が5km以内,72%が50km以内の精度(従来手法では約50%が5km以内,約66%が50km以内)となり,ローカル語の更新により,量,質共に位置推定精度が向上することが示された. ・単語間関連度の更新及び実世界観測情報抽出手法の改良 5つのクエリを用いた実験により,クエリに関連した事象が多く観測されている時には,1日分の約70万件の投稿から80%程度の適合度でそれらの観測情報が抽出できるが,精度は状況により異なり,特に広告などの頻出する類似投稿も誤って抽出されることが確認された.また,単語間関連度を更新する場合,更新しない場合よりも上位に適切な観測情報が提示されることを確認したが,より多くのクエリを用いた定量的な評価が必要である. 以上のように,特に後者の課題について実験が少し遅れている.これは平成27年10月5日より平成28年3月31日まで産前産後休業,及び育児休業を取得したためである.
|
Strategy for Future Research Activity |
今年度は産前産後休業,育児休業を取得したため,研究期間の1年の延長を申請した. よって,次年度は上記の通り,今年度取り組んでいた二つの課題について,以下のようにさらなる改良,実験による評価を行う予定である. ・ローカル語の更新:ジオタグ付き投稿は全体の投稿の1%程度と非常に少ないため,抽出したローカル語,及びローカル語が示す位置の信頼度を考慮しながら,ジオタグの付いていない投稿に対する位置推定結果も用いたローカル語の追加方法などを考案する. ・単語間関連度の更新:多様なクエリを用いた実験による提案手法の汎用性の評価,及び単語間関連度の更新の有効性の評価を行う.また,クエリとして複数の単語を対象とするなど,精度向上のための手法を検討する. 当初,次年度に予定していた二つの要素技術を統合したプロトタイプシステムの構築及びそのユーザ適応性の評価については,次々年度に実施する予定である.
|
Causes of Carryover |
平成27年度10月5日より平成28年度3月31日まで産前産後休業,及び育児休業を取得したため,予定していた対外発表や実験などを実施せず,そのための助成金を使用しなかった.
|
Expenditure Plan for Carryover Budget |
研究期間を1年延長し,次年度は助成金を請求せず,予定していた課題を進めると共に,対外発表や実験などに今年度の残額を使用する.当初次年度に請求予定の助成金は次々年度に請求する予定である.
|