2019 Fiscal Year Annual Research Report
Historical Anatomy of Public Opinion Making in Australia: Public Meeting Data Analysis via Natural Language Processing
Project/Area Number |
19H01330
|
Research Institution | Osaka University |
Principal Investigator |
藤川 隆男 大阪大学, 文学研究科, 教授 (70199305)
|
Co-Investigator(Kenkyū-buntansha) |
中村 武司 弘前大学, 人文社会科学部, 准教授 (70533470)
チョ シンキ 大阪大学, データビリティフロンティア機構, 特任助教(常勤) (70784891)
梶原 智之 大阪大学, データビリティフロンティア機構, 特任助教(常勤) (70824960)
長原 一 大阪大学, データビリティフロンティア機構, 教授 (80362648)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | パブリック・ミーティング / 公共圏 / 自然言語処理 / 世論形成 / デジタル・ヒストリー / オーストラリア史 / Trove / 新聞 |
Outline of Annual Research Achievements |
2019年度、本研究は、オーストラリア国立図書館の包括的な新聞データベースTroveを用いて、19世紀から20世紀の約150年間にわたる全パブリック・ミーティングのデータを抽出し、オーストラリア全土における状況を明示することで、世論形成の構造はいかなるものであり、どのように変化したかを分析するための作業を行ってきた。以下はその活動である。 (1)新聞の広告ページから、パブリック・ミーティングに関する広告を自動的に抽出。自動抽出は広告文章の始まりと終わりのパターンマッチング等により行った。さらに、OCRによる文字認識の誤りを自動的に訂正した。高精度な誤り訂正を実現するために、最先端のDongらの手法などをベースに研究開発を進めた。 (2)上記に関連して、1838年―1954年の新聞広告を各年5件ずつ読み取り、正解データを作成し、活用した。日付/曜日/人名/地名/項目名などのキーワードを自動的に抽出し、時系列・地域別の変化を明らかするために、手書きのカードデータ約1500枚を電子化し、抽出したデータと比較し、活用の可能性を探った。 (3)データベースTroveの内容について最も詳しいTim Sherrattとオーストラリア国立図書館で面会し(現在タスマニアに移動)、協力関係を構築した。 (4)九州大学、東京大学などで講演を通じた広報活動を行った。さらに西洋史学の専門誌への投稿や、自然言語処理関係の学会での報告などにより研究成果を発表し、翌年度の国際学会での報告も承認された。 以上のような活動を行ったが、2月末以降は、COVID-19の蔓延により、所属機関による新たな研究活動の禁止などの影響を受け、予定の研究計画の一部は延期せざるをえなかった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の研究計画は(1)新聞の広告ページから、パブリック・ミーティングに関する広告を自動的に抽出する。自動抽出は広告文章の始まりと終わりのパターンマッチングにより行う。(2)OCRによる文字認識の誤りを自動的に訂正する。高精度な誤り訂正を実現するために、最先端のDongらの手法 をベースに研究開発を進める。(3)上記に関連して、1838年―1954年の新聞広告を各年5件ずつ読み取り、正解データを作成する。(4)日付/曜日/人名/地名/項目名などのキーワードを自動的に抽出し、時系列・地域別の変化を明らかにし、比較し、相関関係を検証して、翌年のシンポジウムの準備をする。キーワードはStanford CoreNLPを用いて解析した上で自動抽出を行う。(5)上記に関連して、使われているキーワードを組織的に集め、整理する。(6)オーストラリア国立図書館の研究員であったN.ブラウン教授を介して、データベースTroveの運営者(オーストラリア国立図書館)と協力関係を築く。(7)ウエブや講演を通じた広報活動を行う。(8)国際学会での報告、専門誌への投稿などにより、研究成果を発表する。の8項目であった。 そのうち(4)の一部、キーワードを自動的に抽出し、時系列・地域別の変化を明らかにし、比較し、相関関係を検証する及び(5)は実現できなかったが、既存の手書きカードのデータを電子化したり、新たな正解データを作成したり、その打開法を探っており、ある程度計画を補えたと思う。しかし、3月以降は翌年のシンポジウムが延期されたり、研究機関の使用禁止が命じられており、シンポジウムの準備会合は開催できなかった。こうした点に問題が生じたが、その他の点では研究は順調であった。また、「直接このテーマに関連する」複数の業績発表を行った点は、想定を上回った部分であり、全体としておおむね順調だと判断した。
|
Strategy for Future Research Activity |
現状では、COVID-19の影響によって、研究を左右する様ざまな状況がわからない。例えば、本研究に必要な特任研究員やRA、アルバイトの新規雇用が禁止されており、いつ雇用できるかわからない。海外への渡航が禁止されており、予定した調査が不可能。予定の学会が延期されており、今後の対応が決められない。所属機関における新たな研究の停止と研究のための出勤・出張の禁止や図書館の閉鎖がいつまで続くかも不明であり、研究の推進方策について検討できる状況ではないなど、研究条件は最悪であり、今後の状況も見通せない。 以上のように、今後の状況がまったく予想できないこともあり、当面は当初の研究計画を大きく変更せずに、可能な限り、Trove等のデジタル資料の調整等を行い、研究の活動の再開の条件が整った場合にすぐに進められるような準備を整えたい。今年度の計画は以下の通りとする。 1 日付/曜日/人名/地名/項目名などのキーワードを自動的に抽出し、時系列・地域別の変化を明らかにし、比較し、相関関係を検証する。 2 パブリック・ミーティングの目的となる文やフレーズ(キーワードでも可)を自動的に抽出する。この段階で、様々な項目間の構造的連関と時間的変化を明らかにし、世論形成構造と公共圏形成の歴史の大枠を明らかにする。 3 第70回日本西洋史学会大会でのシンポジウム開催の準備を行い、実行する。この他、成果報告も継続的に行っていく。
|
Research Products
(8 results)