2020 Fiscal Year Research-status Report
大規模社会調査における欄外記入文のデータ化と分析手法の探究
Project/Area Number |
19K21720
|
Research Institution | The University of Tokyo |
Principal Investigator |
橋本 摂子 東京大学, 大学院総合文化研究科, 准教授 (70323813)
|
Project Period (FY) |
2019-06-28 – 2022-03-31
|
Keywords | 東日本大震災 / 被災避難住民 / 大規模社会調査 / 個人情報保護 |
Outline of Annual Research Achievements |
本年度はコロナ禍による大学活動制限のため進捗に遅れがみられていた13,000票の原票電子化作業をすべて終えることができた。電子化を一通り終えた時点ですべてのファイルを目視で確認し、原票の書き込みが薄く読み取りの難しいものや、別紙に追加で自由記述が書かれた調査票などを含め、個別対応が必要なもののIDをリストアップし、記述内容を電子記録として残すことができるよう再スキャンを実施した。並行して、欄外記入のある調査票のリストアップに着手し、欄外記入のタイプ分け(書き込み場位置、内容、二つの関連性)をおこなった。全体が膨大な作業量であるため、この作業の終了にはさらに時間がかかると予想される。 電子化作業終了にともない、原票は福島大学に返送した。また、データアーカイブへの寄託、およびデータ公開に向けた準備のため、調査票のデータを、1)コードデータ、2)匿名処理済み自由記述データ、3)無処理自由記述データ、4)原票PDF、の4層に分類し、それぞれの内容の確認、公開レベルの設定、および自由回答の記述の中にあらわれる個人情報(準個人情報を含む)の扱いについて福島大学と協議をおこなった。検討の結果、自由記述欄の中に頻出する個人情報および準個人情報としては、地名・施設名(病院名)・病名・親族情報などが挙げられた。また、それらをすべて削ることで、短期間に移動を繰り返す過酷な避難生活の重要な側面が失われてしまう可能性があることも指摘された。一つ一つについて匿名化方針を検討する必要があることを確認し、来年度以降のデータ匿名化処理のための作業準備を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
主にコロナ禍による活動制限のために、作業計画は全体としてやや遅れている。ただし、コロナ禍において複数人同時の作業が困難になったため、もっとも時間がかかると予想された全票の電子化作業を今年度終えることができたため、計画の遅滞は当初の予想よりも軽微となった。来年度以降の作業は個人作業で対応可能なためコロナ禍による活動制限の影響は比較的出にくいと予想できる。
|
Strategy for Future Research Activity |
今後は自由記述における個人情報保護の基本方針を策定し、匿名化処理をおこなったうえで、データアーカイブへの寄託を目指す。昨今の個人情報保護の厳格化により、データ公開に向けた福島大学との協議は当初の計画よりも綿密になされねばならないことも判明した。あわせて、電子化されたデータを用い、欄外記述の収集・分類・分析等を進めていく。
|
Causes of Carryover |
コロナ禍により旅費の執行がなかったこと(旅費)、およびオンライン上で作業を進める環境整備のために、当初計上していなかった機器類の購入が必要になったこと(物品費)、また電子化作業にかかる人件費が予想より抑えられたことなどが挙げられる。今後コロナ収束後には出張などが必要になるため、今年度の余剰金額は来年度以降の旅費への充当を計画している。
|