研究課題/領域番号 |
16K20971
|
研究機関 | 東京大学 |
研究代表者 |
本間 健太郎 東京大学, 生産技術研究所, 助教 (90633371)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 都市計画・建築計画 / 観光 / ジオタグ / マイクロSNSデータ |
研究実績の概要 |
本研究の目的は,魅力的な観光地域を形成する一助とするため,大規模な位置情報データを用いて観光客の動態を多角的に解明・再現することである.本年度は,研究計画に沿って以下の分析を行った. 1.Twitterデータを用いた行動パターン把握と地域分析:33日間に日本で投稿された約750万件のジオタグ付きツイートのデータを用いて分析を行った.分析に使った情報は,投稿の場所と日時および若干の投稿内容である.(1)まずユーザーごとのツイート場所をクラスタリングすることで,個人の居住地および勤務地(もしくは学校所在地)を推定した.(2)それにより個人の日常的行動パターンが分かるとともに,その残余としての観光行動も抽出できる.この観点から,各ツイートの「来訪度」「滞留度」「連投度」の3属性を定義して計算した.(3)これら属性を用いて,カーネル密度推定およびクリギングによって地域特性を可視化した.以上により,「同じ駅でも出口によってユーザー層が異なる」といったミクロな地域分析を網羅的かつ定量的に行えるようになった. 2.Flickrデータの入手および観光行動パターン把握と地域分析:(1)まずFlickr APIを利用して,取得可能なジオタグ付き投稿写真の全メタデータ約2.9億件を入手した.撮影パターンから各ユーザーの居住国を推定し,訪日外国人観光客および他都道府県から来た日本人観光客と思われる計約2.6万人を抽出した.(2)「観光客の居住国」とその「観光先の都道府県」との相性を,クラスターヒートマップにより把握した.それにより例えばアジア人が北海道・大阪・沖縄を相対的に選好していることを再確認した.(3)タグを共起度に基づきクラスタリングし,その地理的分布を分析した.(4)最後に「居住国」と「タグ」を掛け合わせ,例えば「欧米人が『伝統的』と思っているものの地理分布」を把握できるようになった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度はTwitterおよびFlickrの位置情報データを用いて空間統計的な分析を行った.研究計画ではTwitterデータのみの利用を想定していたが,「今後の研究の推進方策」に述べる懸念から,Flickrデータも併せて取得し,両者の分析を行った.それぞれの分析の深度としては,おおむね研究計画のとおりの進捗状況である. データの取得とそのクレンジングは骨の折れる作業であったが,それぞれ大規模なデータベースを構築し,ユーザーごとの時空間行動軌跡を整理した.とくに居住地・勤務地(Twitter)および居住国・観光先(Flickr)の推定においては,既知の統計情報と齟齬の少ない結果を得られており,作成したデータベースは精度が高いことを確認できている.そのため,本年度行ったミクロな地域分析の説得性は高く,なおかつ次年度以降の分析の基礎情報として本データベースを十分に活用できると考えている.
|
今後の研究の推進方策 |
本年度作成したTwitterおよびFlickrのデータベースを用いて,次年度以降も研究計画に沿って分析を進める.本年度はじめは投稿数の多いTwitterデータのみの利用を想定していたが,投稿内容を読むとサンプリングバイアスが強いように思われた(ジオタグ付きツイートは全ツイートの0.5%程度にすぎないと推定されている).一方Flickrは,Twitterほど投稿数が多くないが,旅行者は興味の対象を撮影するという点で観光行動と相性がよく,かつその興味が「タグ」として表出している利点もある.上記の点を見極めて,分析目的に応じて利用データを選択する. 具体的な研究方法としては以下を予定している. 1.旅行者の時間的空間的な集合パターンの解析:学術的かつ社会的に興味深い分析として,「観光地ごとの投稿/撮影ポイントの凝集分散性評価」「観光エリア境界の自動抽出」「時空間的ホットスポットの自動抽出」「投稿/撮影分布と各種施設分布との空間相関分析」を今のところ計画している.これらの分析により,例えば観光資源の分布が分かったり,ブームの兆しがあるエリアをいち早く特定できたり,人気エリアを生む要因をある程度解明できると期待される. 2.観光地選択行動のモデリング:現在のところ,旅行者の観光地選択行動を,その居住国(あるいは投稿/撮影パターンから推測されるその他の個人属性)ごとに,「観光地の各空港からの移動コスト」および「タグ頻度表に基づいた『観光地の魅力度』と『観光地間の類似度行列』」を用いて,GNLモデルをベースにしたモデルで再現することを計画している.これにより,観光地どうしの競合・共生関係が分かり,観光資源の増強に対して来訪者がどの程度増えるかを推定できると期待される. また得られた成果を積極的に学会で報告し論文を投稿することで,社会に発信するとともに,更なる研究の推進を目指す.
|
次年度使用額が生じた理由 |
データ取得およびその整理のために高性能PCが必要と見込んでいた.しかしデータ取得にはむしろ低性能でも台数が必要であることが判明したため,現有のPCを6台同時使用してそれを行った.またデータ整理も現有PCで行った.学会発表として旅費を見込んでいたが,論文を投稿するにとどめた.
|
次年度使用額の使用計画 |
大規模計算が必要な数理解析プロセスになるため,高性能PCの購入を検討している.そのほかに学会発表のための旅費,データ整理のための謝金,参考書購入費を必要としている.
|