研究課題/領域番号 |
20K02152
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分08010:社会学関連
|
研究機関 | 関西学院大学 |
研究代表者 |
中野 康人 関西学院大学, 社会学部, 教授 (50319927)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2022年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | テキストデータ / 社会意識評価辞書 / 国際比較分析 |
研究開始時の研究の概要 |
本研究は、(1)人々の社会意識が表象されるテキストデータを収集し、(2)調査票調査にかわって蓄積されたテキストデータを用いて人々の社会意識や感情を時系列的に抽出・測定する分析手法を確立した上で、(3)国際的共同研究を通じて戦後の社会意識の変動を捉えることを目的としている。 そのために、実験的社会調査と既存のテキストデータの分析によって「社会意識評価辞書」を開発し、国会議事録や新聞記事などのデータに関する国際比較分析をおこなう。
|
研究実績の概要 |
本研究では、蓄積されたテキストデータを用いて人々の社会意識や感情を時系列的に測定することを主目的として、三つの小目的に分割して研究実施計画をたてた。 「小目的1」は、データの収集・整備である。社会意識を遡及的に精度よく抽出するには、ある一定の基準で選別・蓄積されたデータが必要になる。2023年度は、前年度から引き続き twitter社(現 X)のAcademic Research レベルのAPIアクセス権を利用し、2006年以降のSNS空間におけるテキストを収集する予定であったが、API利用に関する突然の仕様変更が強行され、実質的にデータ収集が不可能となり、研究計画に大きな影響があった。テキストデータを通時的に収集できる環境を求めて、いくつかのSNS等のAPIを探索し、そこからデータを網羅的・自動的に収集するライブラリを構築した。加えて、国会議事録データの追加整備、新聞記事データの再整備を行った。蓄積されたデータは、 社会科学のデータ標準である DDI(Data Documentation Initiative)に準拠した形で整理を進めている。 「小目的2」は、社会意識辞書の整備である。そのために、自然言語に含まれる多様な社会意識を評価できる尺度を開発する。小目的1で整備した蓄積データを利用し、単語間の関係を埋め込み表現によって数値化する作業に取り組んだ。今年度は、異なる言語モデルによる数値化を実装し、比較検討することに取り組んだ。その上で、国内外の評価辞書と組み合わせた機械学習を行い、尺度構成に取り組んだ。 「小目的3」は、オランダ戦争資料研究所の研究協力者と共同しての国際比較分析とその発表である。予定していた共同の研究会や学会報告は見送ったものの、近似したモデルで近似したデータを利用した分析結果の比較検討をすることができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2023年度は、それまでに構築し、データソースの重要な核となるはずであったtwitterデータの取得が突然不可能になったため、研究計画の大幅な遅滞と変更を余儀なくされた。データソースをゼロベースで再検討し、データ収集のためのライブラリを構築する段階に立ち戻って作業をやり直したため。
|
今後の研究の推進方策 |
本研究は、2023年度で終了する計画であったが、前述の通り進捗状況に遅滞が生じているため、事業期間の延長を申請し、研究を継続する。 「小目的1」については、このまま継続していく。 「小目的2」については、機械学習による尺度構成を加速していく。 「小目的3」については、共同研究者との成果発表を予定する。
|