2016 Fiscal Year Research-status Report
Relationship between linguistic expression and human behavior for estimating crowd congestion degree after a large earthquake using Twitter data
Project/Area Number |
15K18176
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
沖 拓弥 東京工業大学, 環境・社会理工学院, 助教 (40712766)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 防災・減災 / 混雑度推計 / SNS / Twitter / Webアンケート / 東日本大震災 |
Outline of Annual Research Achievements |
どの程度の群集混雑がどこで発生しているかを,SNS(Twitter)上に投稿されるテキスト情報から推定する上での基礎的知見を得ることを目的に,Webアンケート調査を実施した。 (1)準備:東日本大震災発生前後の24時間(2011年3月11日[金]14時00分から同12日[土]14時00分まで)にTwitterに投稿され,「混雑」または「混む(活用語を含む)」という単語を含むツイートに着目し,混雑の程度を表していると考えられる表現(混雑度表現)52種類(例:あふれる,それほど,やや,非常に)と,群集混雑が発生している状況を撮影した写真(混雑画像)100枚(時間帯4区分×25枚)を抽出した。 (2)実施:被験者1,236名(性別2区分×年齢6区分×103名)に対して,個人ごとに混雑画像4枚(各時間帯から1枚)を無作為に提示することで,被験者が群集混雑下にいる状況を仮想的に設定し,その状況における混雑度を表現するのに相応しいと考える言語表現を,上述の52種類の表現の中から選択してもらった。同時に,各表現から思い浮かべる混雑の程度(10段階評価)と,各表現の日常的な使用度合い,および,画像で想定した程度の混雑状況下における行動選択についても尋ねた。さらに,被験者の属性(年齢・性別・職業・居住地域等)や,SNSの利用状況,混雑情報に対する需要,情報の投稿・提供に対する考え方についても調査した。 (3)結果の集計:上述の52種類の表現のうち,「混雑している」ことを表す表現と,「混雑していない」ことを表す表現の間には,評価点の平均値や頻度分布に差が見られた。また,個人ごとに得られる各表現の評価点と,各画像に対する選択表現に基づき,上述の混雑画像100枚の混雑度を定量化したところ,混雑度推定におけるテキスト情報の有用性が見てとれた。現在,研究成果の発表・論文投稿に向け,さらなる分析を進めている。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
本研究課題における重要な実施項目の一つに,平成28年度に実施するWebアンケートがある。アンケートの結果は,「研究の目的」である「混雑や混乱に対する反応(言語表現・行動選択)に見られる個人差や地域差,性別や年齢ごとの傾向を明らかにし,具体的なモデルを構築」するための入力データとして用いられる。そこで,より有意義な結果を得るために,アンケートで使用するテキストや画像の絞り込み,および,設問の検討を慎重に行った結果,当初の計画よりもアンケートの実施が遅れた(平成28年12月末実施済み)。それに伴い,アンケート結果の集計と分析(実際の混雑度と,人々が眼前の混雑から受ける印象とその表現方法,および,選択する行動との間の関係の分析),さらには,これらの研究成果の学会発表・論文投稿についても,実施時期が遅れている。
|
Strategy for Future Research Activity |
(1)平成28年度の研究成果を利用して,SNSへの情報投稿者の属性(性別・年齢・職業・居住地等)や,各混雑度表現から思い浮かべる混雑の程度,および,各表現の日常的な使用度合い等を説明変数として,投稿されたテキスト情報に含まれる混雑度表現から,実際の群集混雑度や選択行動を推定するモデルを構築する。 (2)平成27年度に購入した,東日本大震災発生前後の24時間(2011年3月11日[金]14時00分から同12日[土]14時00分まで)に投稿されたTwitterデータを用いて,(1)で構築したモデルの精度を検証するとともに,モデルのキャリブレーションを行う。精度検証には,適宜,鉄道運行再開状況等の既往調査を利用する。さらに,最終的に得られたモデルを,上述のデータや追加購入したTwitterデータに適用することで,局所的・突発的に発生する群集混雑の検知に対する本モデルの有効性を検証する。 (3)研究実施期間終了後(平成30年度以降)を見据え,群集混雑時の人間行動意思モデルの構築,緊急車両活動支援や帰宅困難者支援計画策定への応用,および,リアルタイム混雑度推計システムの構築について,具体的な検討を開始する。Twitter等へ投稿されたテキスト情報を自動的に収集し,各地点の群集混雑度を定量化・マッピングする技術を確立すれば,既存の各種システムへの組み込みも可能になる。また,混雑度に関する有用な情報投稿をいかに増やすかも重要な課題であることから,学会発表等の機会を利用して,他の研究者・技術者やサービス提供者等とも積極的に意見交換を行っていく予定である。
|
Causes of Carryover |
Webアンケート実施費用が予定よりも高額となった一方で,研究進捗の遅れに伴い,平成28年度に予定していた学会発表・論文投稿を平成29年度に延期したため,次年度使用額が生じた。
|
Expenditure Plan for Carryover Budget |
当該助成金は,平成29年度の学会発表費・論文投稿費の一部として使用する予定である。
|
Research Products
(1 results)