研究課題/領域番号 |
21K18489
|
研究機関 | 東京大学 |
研究代表者 |
橋本 鉱市 東京大学, 大学院教育学研究科(教育学部), 教授 (40260509)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
キーワード | SNS / 計量テキスト分析 / ネットワーク / 参加者 / 問題群 |
研究実績の概要 |
本研究は高度情報化時代において高等教育政策がどのように形成・決定されていくのかを、特にその政策過程の初期段階に着目して、①問題群とその範囲、②参加者とその関係性、③そこで生成・構築される物語(ストーリーテリング)、という3つの分析課題を設定し、それぞれ以下のような方法論による分析を試みる。すなわち、①問題群とその範囲については、Webスクレイピングソフトなどを利用して、問題群と参加者に関係するデータセットの構築・分析を行うとともに、感情分析ソフトなどを利用して、言葉の背景にある心情分析を行い、どのデータ・記事がどの程度の感情を触発しているのかを考察を試みる。②参加者とその関係性については、上記のデータセットを利用して、そこに現れた個人・中間団体・諸機関などを対象に、それらの関係性の解明を試みる。③参加者らにより問題群が取り上げられる際に生成・構築された様々な語りが、どのような特徴を持つのかを、テキストマイニングソフトなどを利用しつつ分析し、そのパターンや骨組の共通性の分析を試みる。 今年度は、3カ年にわたる補助事業期間の初年度にあたるが、その実績の概要は以下の通りである。研究協力者である西村幸浩、寺田悠希、鎌田健太郎(いずれも東大大学院教育学研究科大学院生)の諸氏とともに、Twitter社から2021年1月に学術研究用に公開されたAPIならびに国立情報学研究所から公開された「Yahoo!知恵袋」のデータセットの提供を受けた。また「国会会議録」のデータの検索用APIを利用して、2000年代以降の文部科学委員会(衆議院)ならびに文教科学委員会(参議院)の発言データを収集した。これらのデータから、高等教育領域における問題群と参加者に関係するデータセット構築を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
上記の「実績概要」にも触れたように、Twitter APIならびにYahoo!知恵袋データによるデータセットを整備した。前者は2006年以降の全データ(フルアーカイブ)であり、また後者の収録期間は2016年4月1日から2019年3月31日までのデータである(質問数約263万、回答数約670万。データ項目は、質問・回答のID、質問のカテゴリ、質問・回答のタイトル、本文、投稿および解決の日時などだが、これらのうち、本文のみを対象)。なお、これらのデータの学術研究についての使用については、Twitter社ならびに国立情報学研究所のデータ使用規約、同意書などで承認を受け、さらに東大による倫理審査専門委員会による審査を受け承認されており、今後の詳細な分析を行う準備を整えることができている。また国会会議録については、2000年代に入ってからの衆参両院の文教関連委員会の会期、委員の属性などが、研究協力者の西村氏を中心として、項目として収集済みである。APIではPython等のプログラム言語を用いてデータを取得した。 なお計画当初、本研究ではスクレイピングソフトや感情分析ソフトなどを利活用して、データセット構築と分析を計画していたが、Twitter社、国立情報学研究所、国会の提供・公開された大規模なデータを学術利用することによって、より正確かつ簡便な形で分析を進めることが可能となり、順調な進捗状況といえる。
|
今後の研究の推進方策 |
上記の各種データセットを利用して以下のような分析を進める予定である。まず、2000年代に入ってからの衆参両院の文教関連委員会のデータについては、全体的な頻出単語とその推移、時期別・アクター別などにみた発言回数や発言内容の特徴分析のほか、全体の発言内容のトピック分析を試みる。それにより、国政レベルでの教育関連イシューのトピックを総括するとともに、その経年変化、アクター(党派、委員の身分別など)の属性ごとの特徴などを抽出する。さらに、発言に含まれる単語表現から、感情分析などを試行する。また、「Twitter」ならびに「Yahoo!知恵袋」のデータセットは、上記の国会会議録との発言とのタイムラグに着目して、市井での問題認知と国政レベルでのイシュー・アジェンダセッティングとの時間的な経過分析などを視野に入れながら、それぞれのデータから問題化、イシュー化、アジェンダ化に至るプロセスを追いかける。また、これらの分析から得られた知見は、学会発表、紀要などでの中間報告、査読誌への投稿などを通して、本研究の成果として公表を行う。
|
次年度使用額が生じた理由 |
計画当初、本研究では大型のサーバーや様々なソフトウェア類などを購入して、データセット構築とその分析を計画していたが、Twitter社、国立情報学研究所、国会の提供・公開された大規模なデータを学術利用することによって、より正確かつ簡便な形で分析を進めることが可能となり、大幅な経費の節約が可能となった。今年度は、研究の深堀りを進めていくための分析ソフトなどの購入と利活用を計画している。
|