2022 Fiscal Year Research-status Report
International Comparative Text Data Analysis with 'Social Consciousness Lexicon'
Project/Area Number |
20K02152
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
中野 康人 関西学院大学, 社会学部, 教授 (50319927)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | テキストデータ / 社会意識評価辞書 / 国際比較分析 |
Outline of Annual Research Achievements |
本研究では、蓄積されたテキストデータを用いて人々の社会意識や感情を時系列的に測定することを主目的として、三つの小目的に分割して研究実施計画をたてた。 「小目的1」は、データの収集・整備である。社会意識を遡及的に精度よく抽出するには、ある一定の基準で選別・蓄積されたデータが必要になる。2022年度は、twitter社のAcademic Research レベルのAPIアクセス権を利用し、2006年以降のSNS空間におけるテキストを収集し、収集環境を整えた。加えて、国会議事録データの追加整備、1960年以降の歌謡曲歌詞データの整備を行った。蓄積されたデータは、 社会科学のデータ標準である DDI(Data Documentation Initiative, http://www.ddialliance.org/)に準拠した形で整理を進めている。 「小目的2」は、社会意識辞書の整備である。そのために、自然言語に含まれる多様な社会意識を評価できる尺度を開発する。小目的1で整備した蓄積データを利用し、単語間の関係を埋め込み表現によって数値化する作業に取り組んだ。その上で、国内外の評価辞書と組み合わせた機械学習を行い、尺度構成に取り組んだ。 「小目的3」は、オランダ戦争資料研究所の研究協力者と共同しての国際比較分析とその発表である。対面ベースでの交流が困難な状況が続いているため、予定していた共同の研究会や学会報告は見送った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2022年度は、蓄積したテキストデータを教師無し学習によって数値化する作業に集中したため、教師あり学習のもととなる対面での調査票調査が実施できなかった。また、研究交流・研究報告の場と想定していた国際学会や海外研究機関との研究会が、世界的な渡航制限によって実質的に参加不可能となったため。
|
Strategy for Future Research Activity |
「小目的1」については、このまま継続していく。 「小目的2」については、機械学習による尺度構成を加速していく。 「小目的3」については、当面オンラインでの発表や交流に頼らざるを得ない。
|
Causes of Carryover |
2022年度は、収集した大規模コーパスの機械学習にエフォートを集中し、対面での調査票調査が実施できなかったため。また、研究交流・研究報告の場と想定していた国際学会や海外研究機関との研究会が、実質的に参加不可能となったため。 2023年度に、収集した大規模コーパスの機械学習とその人的評価を実施する費用に充当する予定である。
|