2016 Fiscal Year Research-status Report
ソーシャルビッグデータにおけるデータ分析とデータ管理の統合理論の構築と実践
Project/Area Number |
16K00157
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
石川 博 首都大学東京, システムデザイン学部, 教授 (60326014)
|
Co-Investigator(Kenkyū-buntansha) |
江原 遥 国立研究開発法人産業技術総合研究所, 人工知能研究センター, 研究員 (60738029)
廣田 雅春 大分工業高等専門学校, 情報工学科, 助教 (70750628)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | ソーシャルデータ / ビッグデータ / 統合分析モデル / 観光情報 / ジオソ-シャル / 時系列データ |
Outline of Annual Research Achievements |
・統合分析モデル: ソーシャルビッグデータの理論モデルの検討結果として,統合分析モデルを,索引付き集合族をベースとして構築できることを思いついた. ・自然言語処理: 地域について記述したソーシャルデータに出現する単語のWord2Vec(頑強な解析手法である分散表現)による学習に基づいて,どういう単語(次元)が特定の地域を特徴づけるか分析した.本結果は観光情報学会で報告した. ・ジオソーシャル・時系列データ分析: 一般に新たな応用を企画するために,複数の異なるソーシャルビッグデータの組み合わせ(関係性)を発見する必要がある.時間・位置情報の付いた異なるソーシャルメディアの特徴の違いに注目して,外国人観光客が手軽に利用可能なwifiスポットの設置場所の候補を発見する方式を開発・評価し,その結果をソーシャルメディア関連の国際会議SocInfo12016で発表した.またオープンデータ(道路,避難所,危険度)とソーシャルデータ(密集する場所と時間帯)を組み合わせて,災害時の最適な避難経路を計算する手法を考案・評価し,その結果を国際会議ACM LBSN 2016で発表した.さらに時系列のソーシャルデータとオープンデータの関係を利用して,桜や紅葉の見ごろなどを正確に予測する方式を情報学に関する国際会議IWIN2016で発表し,最優秀プレゼンテーション賞を受賞した. ・ユースケース収集:5か月間にわたって,百貨店,ホテル,鉄道,観光協会など観光事業者に対してインタビューによりニーズ調査を行った.この結果をもとにして,ソーシャルメディアを用いて旅行者の行動分析や経路分析,さらにはスポットの訪問前後の感想の変化分析などの研究を行った.そのうち行動分析手法については人工知能関連の国際会議AI4Tourismで発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
すべての課題において,本年度の成果を国際会議など外部に発表・投稿することができた.検討実験した技術の具体的課題(観光情報など)への適用の見通しを得た.国際会議並びに国内研究フォーラムで行った発表が受賞した.
|
Strategy for Future Research Activity |
平成29年度以降は,ユースケースの開発を進めて,論理層を中心に時空間分析基盤・情報抽出内容分析基盤の機能設計とその実行エンジンの実現と速度向上を達成する.具体的には以下のように研究を進める. (課題A)構築した代数操作からユースケースの記述に適用し,それらの妥当性の検証を行う.その評価をもとにさらなるモデルの改良を行う.(課題B1)複数のホットスポットの階層化とホットスポット間にある関係の発見方式を確立する.さらに多次元インデクスの利用や並列化を含めた手法高速化の検討・実験を行う.(課題B2)分散表現を用いた内容語に基づき,ツイッター記事(ツイート)の極性分析手法を開発する.さらにこれを用いて,同一内容語の地域別の印象評価や地域に固有の内容語の発見などを行い,観光などのユースケースで評価を行い,手法の妥当性を検証する.(課題B3)バースト検出関連のアルゴリズムの考案と評価,並びにバーストのハイレベルなモデル化の実現を目指す.リアルタイムな時系列データ(ストリーム)へ有効な方式として移動平均法などのフィルタ利用も考える.ここでは特に予測をタスクとして考えて,開発する.(課題C)モデルの変換・写像と実行アルゴリズムを実装し,ユースケースに適用していき,提案内容の妥当性の検証を行う.これらの評価結果をもとにさらなるモデル実現手法の改良を行う.
|
Causes of Carryover |
理論的枠組みの研究と調査・小規模実験が主で費用が少なくて済んだため.
|
Expenditure Plan for Carryover Budget |
より実験・実装を推進するために計算資源を増強し,その成果を海外も含めて積極的に発表する.
|
Research Products
(45 results)