研究課題/領域番号 |
15K18176
|
研究機関 | 東京工業大学 |
研究代表者 |
沖 拓弥 東京工業大学, 理工学研究科, 助教 (40712766)
|
研究期間 (年度) |
2015-04-01 – 2017-03-31
|
キーワード | 防災・減災 / 混雑度推計 / SNS / Twitter / Webアンケート / 東日本大震災 |
研究実績の概要 |
東日本大震災発生前後(2011年3月11日14時00分~12日14時00分)にTwitterに投稿された日本語Tweetのうち,混雑状況を表現する際に使用されやすいと考えられる「混む(変化語も含む)」「混乱」「混雑」の3語を少なくとも1語含むTweet(混雑ツイート)に着目し,分析を進めた。 (1)まず,混雑ツイートの時間推移と多くの人々が帰宅を試みた時間帯を比較し,混雑状況の時間推移の把握における有効性を示した。次に,混雑ツイート中に共起する固有名詞(特に,鉄道駅名と鉄道路線名)をKH Coderを用いて抽出し,その頻度や時空間的特性を分析することで,Tweetに付属する位置情報(ジオタグ)に頼ることなく,混雑ツイートの空間分布をある程度把握できる可能性を示した。具体的には,都心部の地下鉄や山手線,大規模鉄道ターミナル駅において突出して混雑ツイート数が多く,また,混雑ツイート数が増加するタイミングは,各鉄道路線の運転再開時刻と良く対応していた。 (2)混雑ツイートの多さは,ある時刻・地点における混雑状況に対する人々の関心の高さを示していると考えられるが,実際の混雑の程度を把握するには,Tweet数だけではなく,Tweet本文の内容そのものをより詳細に分析する必要がある。そこで,(1)で用いた混雑ツイートからランダムに選択した1,000Tweetを対象に,目視にて混雑度表現を抽出し,その特徴を分析した。このうち,混雑度表現が含まれるTweetは37.5%であり,混雑「している」ことを伝える表現の方が,混雑「していない」ことを伝えたい表現に比べ,種類・登場頻度ともに多かった。 平成27年度は,(2)で抽出した混雑度表現を定量化するために,程度を表す言語表現の定量化に関する既往研究のレビューまでを行った。これをもとに,平成28年度に被験者実験を実施する予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
(1)当初は,東日本大震災発生前後24時間(2011年3月11日14時00分~12日14時00分)に投稿された全Tweetを購入する予定であったが,全体の10%程度の数のTweetであっても,十分に混雑ツイートの分析が可能であることを確認した上で,前後1週間のTweetまで範囲を拡大して購入することが出来た。これは,平成28年度に,震災時と平常時の投稿傾向の違いを分析することを見据えたものである。 (2)購入したTweetデータから,自然言語処理の手法を用いて「混雑ツイート」を時空間情報とともに抽出する作業,および,「混雑ツイート」群から「混雑画像」群と「混雑ワード」群を抽出する作業については,当初の予定通り完了した。また,「混雑画像」群の利用可能性について検討し,想定よりも利用可能な画像数が少なかったことから,分析に利用できる可能性のあるURL付きのTweetを追加購入した。 (3)混雑度表現の定量化のために平成28年度に実施予定であるWebアンケートの回答項目の検討については,概ね当初の予定通りに完了した。当初は,本学の学生を対象とした予備アンケートを複数回実施し,その結果をもとに回答項目等の検討・修正を繰り返す予定であったが,平成27年度はこの段階まで至らなかった。ただし,目視による混雑度表現の抽出と傾向の分析,および,言語表現の定量化に関する既往研究のレビューなど,Webアンケートをより有意義なものとするための検討を,慎重かつ十分に行うことが出来たと考えている。
|
今後の研究の推進方策 |
(1)平成27年度の研究成果に基づき,混雑度表現の序列化,および,混雑状況下において選択される混雑度表現の把握を目的として,Webアンケートを実施する予定である。混雑状況は,あらかじめ収集した混雑画像(混雑状況を撮影した写真)を被験者に示すことで,仮想的に設定する。このとき,可能な限り多様な属性(性別・年齢等)の被験者に協力を依頼することで,混雑状況別,属性別,個人ごとに異なる混雑度表現の選択傾向を定量化できると考えている。現時点では,多数の一般モニターが登録している民間調査会社に委託して実施する予定である。 (2)Webアンケートの集計結果に基づき,人々が眼前の混雑から受ける印象とその表現方法,および,選択する行動との間の関係を分析,定量化する。 (3)平成27年度に購入した,東日本大震災発生前後24時間以外のTweetデータに対しても,(2)で得られた結果を適用することで,震災時と平常時の投稿・言語選択傾向の違いを分析する。これは,当初の研究予定には含まれていない発展的内容である。 (4)研究実施期間終了後(平成29年度以降)を見据え,混雑度の人間行動意思モデルの構築,緊急車両通行や帰宅困難者支援計画策定への応用,および,リアルタイム混雑度推計システムの構築について,具体的な検討を開始する。Tweetを自動収集し,各地点の混雑度を定量化,マッピングする技術を確立すれば,既存のシステムへの組み込みも可能になる。また,混雑度に関する有用なTweetをいかに増やすかも重要な課題であることから,学会発表等で他の研究者やサービス提供者等とも積極的に意見交換を行っていく予定である。
|