2020 Fiscal Year Research-status Report
観光資源の発掘・再評価 -機械学習による写真共有SNS分析を軸として-
Project/Area Number |
19K12569
|
Research Institution | Shikoku University |
Principal Investigator |
辻岡 卓 四国大学, 経営情報学部, 准教授 (20389159)
|
Co-Investigator(Kenkyū-buntansha) |
渡辺 公次郎 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (30372717)
塚本 章宏 徳島大学, 大学院社会産業理工学研究部(社会総合科学域), 准教授 (90608712)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 特徴分析 / クラスタリング / 観光資源魅力抽出 / Instagram / AI |
Outline of Annual Research Achievements |
2020年度は画像共有SNS(Social Networking Service)から収集した画像データをクラスタリングする手法の確立に注力した。対象SNSとしてInstagramを取り上げ、#徳島観光, #大塚国際美術館等のハッシュタグで収集した画像群を人間が目視分類した結果と同様のクラスタ群を得ることを目標とした。 初旬はクラスタリングの前処理の次元削減手法としてCNN(Convolutional Neural Net)を用いた。その結果、画像の特徴を4,096次元まで削減できた。しかし、これら特徴量を用いたクラスタリング結果は人間が目視分類した結果には程遠いものであった。原因としては「まだ次元数が大きすぎる」「同じ観光地でも画角が異なると特徴量に大きな差が出る」ためと考えられる。 中旬以降はCNN利用の際にVGG16を用いた転移学習を実施し、特徴量を1,000次元まで削減することができた。さらに非線形データに強い次元削減アルゴリズムであるt-SNE(t-Distributed Stochastic Neighbor Embedding)を用いて、特徴量を3次元空間に配置することができた。これら特徴量を基にクラスタ数未所与でもクラスタリング可能なDBSCAN(Density-Based Spatial Clustering of Applications with Noise)で分類した結果、一定の成果を得ることができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
画像群のクラスタリング手法確立に関して、当初想定した水準の達成を果たした。テストケースとして採用した大塚国際美術館(2020年投稿分)の画像群2,653点は36クラスタに分類された。また凝集度の最も高い9クラスタの示す内容は人間が目視分類した結果と遜色がないものであった。 Instagramに投稿された画像群のうち、これら凝集度の高いクラスタの示す内容は観光資源の魅力を抽出したものである。また凝集度が劣るクラスタ群に関しては、まだ広く周知されていない潜在的な魅力を示す内容が含まれている可能性がある。 これら魅力抽出に際して労力を大きく削減することができる提案手法は、観光地のマーケティングコスト削減、未知の魅力発見に寄与すると考えられる。
|
Strategy for Future Research Activity |
当該年度は転移学習の採用により、次元削減作業が大幅に進展した。一方でAuto Endcorderなど他の次元削減手法を用いることで、より人間の目視に近しいクラスタリング結果を得ることができる可能性があり、これらを試す予定である。 また得られたクラスタを詳細に分析し、明らかとなった各観光資源の魅力を地域に還元したいと考えている。
|
Causes of Carryover |
新型コロナウイルスの流行に伴い、(1)予定していたフィールドワークが実施できなかった、(2)成果発表として予定していた日本観光学会・日本観光情報学会全国大会が開催されなかった、(3)渡航制限のため各種国際会議での発表が叶わなかった等のため、多額の余剰旅費が発生した。このため、次年度使用額が生じた。 これら次年度使用額は、情勢が許せばフィールドワークと成果発表を実施するために旅費・学会参加費として活用したい。また、データ分析に用いている現有の情報機器の老朽化が進んでいる。このため、新規のコンピュータを導入するために活用したいと考えている。
|