2019 Fiscal Year Research-status Report
語の意味演算のための時空間における偏在性と遍在性に着目したベクトル空間モデル構築
Project/Area Number |
19K11982
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
横山 昌平 首都大学東京, システムデザイン研究科, 准教授 (20443236)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | ジオソーシャルビッグデータ |
Outline of Annual Research Achievements |
本研究計画の骨子をなすジオソーシャルビッグデータを用いた新たな指標、Geo-representativeness(地理的説明性)についての定義づけおよび、実データを用いた検証を行った。初年度の成果としては、(1)地理的偏在性を有するソーシャルビッグデータの効率的なクローリング技術、(2)遍在性を排除し、偏在性を強調するクラスタリングアルゴリズムの提案において成果があった。 前者においては、Google Mapsの口コミを効率的に収集するための、大規模時空間データベースに対する近傍探索クエリ配置方法に関する提案を行った。これは、データ分布が未知の領域において、地図データを元に、クエリ配置を決定する手法で、独自性が高い。 後者においては、ジオタグ付き写真の撮影者の移動軌跡を用いる、全く新しい密度クラスタリング手法を提案した。このアルゴリズムは、従来、密度を直接的に計算するしかなかった密度クラスタリングの手法を、線分の交点探索アルゴリズムであるBentle-Ottomanに基づいて計算するため、データ統計的に密度の不明な対象に対しても、効果的なパラメータ設定が期待できる。Bentle-Ottomanは、計算精度に非常にセンシティブであり、実用的な実装の構築が困難であるが、我々はジオソーシャルデータに対して、現実的な性能を有するアルゴリズムを開発した。 さらに、本件研究計画を遂行する過程で明らかになった、ソーシャルデータの二次利用に関する著作権の波及範囲の問題についても研究に取り組んだ。具体的には、インターネットで公開された文章から著作権法10条2項の例外規定に該当する部分文章を抽出する試みである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画の基盤となる、ジオソーシャルビッグデータの偏在性と遍在性に着目したデータクローリング技術に関して、顕著な成果を上げる事ができた。またその成果を論文誌発表、複数の国際会議発表など通じて、広く公知する事ができた。 また、時空間データに対する、全く新しい密度クラスタラング手法の提案について、その端緒となる研究発表を行う事ができた。これに関しては今後の発展が期待でき、本研究期間全体を通した柱となりうる技術である。
|
Strategy for Future Research Activity |
研究の二年目においては、場所あるいは語のセマンティックを適切に表現する特徴量ベクトルの構成法に関して検討する。本研究で想定するベクトル空間では、メディアタイプに依らず、画像であっても、文章であっても、またどのような言語であっても、同じセマンティックを持つデータには、類似したベクトルが与えられる。このような特徴を持つベクトル空間モデルの実現に取り組む。
|
Causes of Carryover |
COVID-19により年度末開催の参加研究会がオンライン開催になったため、当初の研究計画に一部変更が生じた。次年度使用額は疫病蔓延期の新しい研究様式に対応するために、遠隔研究デモンストレーション環境の拡充などに、利用する予定である。
|