2021 Fiscal Year Research-status Report
観光資源の発掘・再評価 -機械学習による写真共有SNS分析を軸として-
Project/Area Number |
19K12569
|
Research Institution | Shikoku University |
Principal Investigator |
辻岡 卓 四国大学, 経営情報学部, 准教授 (20389159)
|
Co-Investigator(Kenkyū-buntansha) |
渡辺 公次郎 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (30372717)
塚本 章宏 徳島大学, 大学院社会産業理工学研究部(社会総合科学域), 准教授 (90608712)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 観光資源評価 / SNS / 機械学習 / クラスタリング |
Outline of Annual Research Achievements |
2021年度は画像共有SNS(Social Networking Service)から収集した画像データを人力および機械学習手法にてクラスタリングを実施した。その後にクラスタリング結果の観光資源評価への応用可能性について検討した。対象SNSとしてInstagramを取り上げ、徳島県内の観光地・施設を対象に収集・分析を実施した。 第一の成果は人力(目視)によるクラスタリングを実施することで、画像クラスタリングの観光資源評価に対する有用性を評価した点にある。「#徳島観光」にて検索・収集した約700枚の画像の撮影地点を推定し、地図上にプロットすることで観光客の訪問場所・興味を推定することができた。同様に「#祖谷のかずら橋」にて検索・収集した画像から無作為に400枚を抽出し、それらの構図をクラスタリングした。その結果、ガイドブック等に倣った「定番型」と自撮り等を含む「SNS型」に大別することができた。「SNS型」写真を撮影するための場所を適切にPRすることが観光客誘致に有効である点を定量的に示すことができた。 第二の成果はハッシュタグ#大塚国際美術館で検索・収集した画像約3,000枚を機械学習手法により151クラスタに分類した点である。具体の手法はVGG16による各画像の特徴量抽出、t-SNEによる次元削減、DBSCANによるクラスタリングからなる。クラスタリングの的中率は約70%であり、観光資源評価のコスト削減が期待できる。 また主たる目的からはそれるが、SNS投稿文を用いた観光資源評価にも併せて取り組んだ。英語圏にて盛んに活用されている観光ポータルTripAdvisorを用いて日本各地の観光施設に関する投稿文を収集し、これらに対して分析を実施した。今後は投稿画像と投稿文を併せて分析することで、より効果的に観光資源評価が実施できると考えている。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
コロナ禍により観光需要が減少しているため、SNSへの投稿も併せて減少している。このため投稿画像の収集に困難が発生している。機械学習手法による教師なし学習で画像をクラスタリングするためには大量の画像データが必要である。中でもインバウンド観光客の我が国観光地に対する興味の明確化が本研究の軸の一つであったため、計画が大きく遅延している。 2021年度においては過去のデータ等も積極的に活用した。しかし、本研究はフィールドワークによる実地検証も併せて行うこととしているため、それらを含めて次年度へ持ち越すこととした。
|
Strategy for Future Research Activity |
評価付き(星付き)SNS投稿を教師データとして投稿文・画像の分類を試みる。教師なし機械学習に必要な大量のデータを得ることは現状では困難が伴うため、教師データの活用を視野に入れることとした。具体の教師データとしてTripAdvisor、GoogleMap、じゃらん等への投稿を活用する。これらデータで学習したモデルでTwitter等の評価無し投稿文・画像のセンチメント分析を実施する。 センチメント分析により投稿文・画像はネガティブ・ポジティブ・いずれでもない、の3つに分類されることとなる。ネガティブ・ポジティブ投稿に対して形態素解析や比較分析を実施することで、各観光地の強み・弱みを把握することができる。またいずれにも当てはまらない投稿文の多くはマーケティング目的の投稿が含まれると考えられるため、多様な分析を実施する前のデータクレンジングとして有益であると考えられる。
|
Causes of Carryover |
コロナ禍による観光需要の減少、およびこれに伴うフィールドワークの困難のため、研究に遅延が生じた。また国際会議をはじめとする発表機会の減少も理由としてあげることができる。 次年度はTwitterAPIの有償プランを契約し、過去データを収集することで研究を進捗する。また新型コロナウイルスの感染状況がピークダウンすれば、フィールドワークを実施するとともに、国際会議に参加し海外へ成果を発信する。このための旅費として使用したいと考えている。
|
Research Products
(4 results)