研究課題/領域番号 |
19K11982
|
研究機関 | 東京都立大学 |
研究代表者 |
横山 昌平 東京都立大学, システムデザイン研究科, 准教授 (20443236)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | ソーシャルビッグデータ |
研究実績の概要 |
本年は、ジオソーシャルデータ、特に、Googleマップに投稿された口コミデータを対象として、地図上の任意の場所から、その場所を特徴づけるような語を発見する手法について研究した。これを達成するために、データの収集と分析の2つのアルゴリズムを提案した。データの収集に関しては、研究代表者の横山が日韓の当該分野の研究者を集めて開催されるKorea-Japan (Japan-Korea) Database Workshopにおいて招待発表を行った。ジオソーシャルデータの収集と分析における課題は、あらかじめデータの地理的な分散や密度分布が分からない状態で、収集クエリに適切なパラメータを与えなければいけないという点である。この問題に対して、地図データを利用し、データ密度が高い所を予測して、クエリを高密度に発行するアルゴリズムを提案した。これにより従来よりも高い効率でデータの収集が可能となった。 また集めたジオソーシャルデータから、任意の場所の特徴語を抽出するために、語の意味的分散と地理的分散を二次元空間としたときに、この複数次元においてk-meansを行い、結果を効果的に畳み込むアルゴリズムを実現した。例えば、高知市内のレストランにおいて、他地域とは顕著に異なる語は何かという事が抽出でき、それは例えば、高知市内のおける名物料理を意味する事が期待できる。例えば有名な「カツオのたたき」等の語を出すとともに、「ウツボ」などの、従来なら有名な名物料理の影にあるような、隠れた名物も、機械的に取り出せるようになる。 また、このような地理情報を有するデータから、それが高密度に集まっている場所をクラスタとして取り出すクラスタリングアルゴリズムを提案した。従来、DBSCANという古典的なアルゴリズムが良く使われているが、ユーザの軌跡を考慮する事によって、地理的なアクセス性をクラスタ構成に反映させる事ができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
コロナ禍の影響で国際会議の延期等の影響は受けたが、研究の進捗自体は順調に進んでいる。とくにDBSCANという古典的な地理データクラスタリングアルゴリズムを置き換える、ジオソーシャルビッグデータの分析に適したEBSCANというクラスタリングアルゴリズムを実現し、学術論文への採録を得た事により、研究最終年度の課題の実現性が大幅に高まった。
|
今後の研究の推進方策 |
現在当該課題に関して国際会議への投稿を3件進めており、研究期間の最終年度として、成果の公表に努める。また、本研究実施により、新たに発見された研究課題について、整理し、本研究課題終了後を見越した成果の発展的な展開についての検討を開始する。
|
次年度使用額が生じた理由 |
次年度使用額は端数であり消費しなかった。
|