2021 Fiscal Year Research-status Report
Cross-cultural analysis of changes in news coverage on COVID-19 in Japanese, German and American media combining qualitative text analysis and big data machine learning
Project/Area Number |
21K13444
|
Research Institution | Keio University |
Principal Investigator |
佐藤 友紀子 慶應義塾大学, 政策・メディア研究科(藤沢), 特任講師 (90844829)
|
Project Period (FY) |
2021-04-01 – 2023-03-31
|
Keywords | 日・独・米新聞報道記事データベース構築 / コロナ禍報道のテーマ分析 / 自然言語処理技術構築 |
Outline of Annual Research Achievements |
本研究は、日・独・米の3つの異なる地域において発信されるCOVID-19に関する大規模なニュース記事データ(合計6つの全国紙)を対象に、質的分析と大規模機械学習を組み合わせた「異文化横断型の質的・量的混合テクスト分析手法」を構築し、コロナ禍報道の受容過程を解明する。2021年度の研究活動では、2020年1月より日・独・米で発信されたCOVID-19に関する、大規模な報道記事テキストを質的・量的に分析するための、記事データ収集と大規模なコーパス作成を行った。具体的には、日・独・米で発信されている購読数が高い異なる6つの新聞紙(朝日新聞・讀賣新聞・USA Today・The New York Times・Bild Zeitung・Sueddeutsche Zeitung)の報道記事データベースおよび各新聞の記事構成を協力者と共に調査し、COVID-19に関する報道記事データを蓄積する統合型プラットフォームの作成、検索キーワードを統一するための共通キーワードの設定、データ入力カテゴリーの選定を行った。その結果、現時点で2万件以上の記事を収集済みである。 同時に、論文執筆の準備も進めた。報道記事テキストの分析を質的データ分析ソフトウェアであるMAXQDAを用いて進行させ、264件ものテーマカテゴリーを発見している。また、先行研究調査も進め、本課題に関わる比較文化の観点から行う質的あるいは量的な報道分析論文や自然言語処理技術に関する論文のレビューを行い、本研究の社会的および学術的意義、新たな質的・量的自然言語処理手法の具体的な工程を検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
想定した以上にCOVID-19に関する報道記事の量が多い点、および、各報道データベースで出力される報道記事とデータフォーマットが異なるため、報道記事データを手動で入力せざるおえない点から、研究進捗の遅れが心配されたが、協力者の人数を増やすことで対応している。今年度はデータの整理と分析を踏まえて、研究成果の公開に集中する。
|
Strategy for Future Research Activity |
今後は下記のように①~③のフェーズに分けて取り組む計画である: ①)データの対象期間を2020年1月に絞り、質的分析手法であるテーマ分析を用いて、報道テーマカテゴリーを作成・整理する。その後、量的解析である主成分分析に取り組み、1月における報道内容の変化を可視化する。その際に本手法の問題点・改善点を発見・改善案を検討する。 ②)データの対象期間を1年間に設定し、ランダムサンプリングにより、①のテーマカテゴリーを拡大させる。主成分分析を行うことで、カテゴリーの時系列な変化をどこまで統計的に可視化することができるか、検証する。同時に、大量のカテゴリーをテクストに自動で付随する質的調査方法を自動化する方法を検討する。 ③)②の段階で得たカテゴリーを用いて、一年間の全記事を分析し、カテゴリーの変化を示すことと質的分析と量的分析から得た実験結果の深い考察に取り組む。
|
Causes of Carryover |
設備備品費と人件費・謝金の調整により、次年度使用額が生じた。2022年度は次年度使用額を人件費・謝金へと繰り越す形で使用する予定である。
|