自然言語処理技術を用いた日英仏議会テキスト解析による国会の特質・変則性の解明
Project/Area Number |
20K20509
|
Research Category |
Grant-in-Aid for Challenging Research (Pioneering)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 6:Political science and related fields
|
Research Institution | Gakushuin University |
Principal Investigator |
野中 尚人 学習院大学, 法学部, 教授 (90264697)
|
Co-Investigator(Kenkyū-buntansha) |
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
狩野 芳伸 静岡大学, 情報学部, 准教授 (20506729)
三輪 洋文 学習院大学, 法学部, 准教授 (20780258)
|
Project Period (FY) |
2020-07-30 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥20,800,000 (Direct Cost: ¥16,000,000、Indirect Cost: ¥4,800,000)
Fiscal Year 2023: ¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2022: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2021: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2020: ¥7,930,000 (Direct Cost: ¥6,100,000、Indirect Cost: ¥1,830,000)
|
Keywords | 自然言語処理 / 議会テキスト / 議会討論 / 国会 / Bert / SNS / 画像処理 / 日英仏比較 / トピックモデル / 議会テキスト分析 / 比較議会論 / 議会データベース / 国会の特質 |
Outline of Research at the Start |
本研究では、申請代表者がこれまでに蓄積・データベース化してきた大量の議会(国会)審議記録のテキストを対象とし、自然言語処理の技術革新を取り込むことによって新しい融合的な実証研究を展開し、それによって比較議会論から見た国会研究の水準とその理解を飛躍的に高めることを目指す。 こうした作業によって、国会での議員間「討論」や与野党間関係に関わるいくつかの重要な特質が比較議会論的な見地から明らかになる。
|
Outline of Annual Research Achievements |
本年度は研究プロジェクトの第3年度であったが、コロナ感染症の影響が続いたため、対面での研究会合や学会等への出席などにはやや不利な条件が続いたが、年度の最後のところからは、対面での研究会に切り替えた。Zoomによってもかなりの効果が獲得できたが、対面での会議もいろいろと異なる役割があることも確認できた。 本研究では、自然言語処理技術を用いる上で、そのためのデータセットの構築が極めて重要であるが、それについてはかなりの進展が達成できた。1つは、国会議員の国会での発言活動について、衆議院分のデータ・ベースからさらに抽出したデータ・セットを構築し、それを用いて連立政党間(自民党と公明党の間)での発言の傾向を分析する作業を進めた。政党・内閣への支持の推移に加えて、自然言語処理の手法を用いて、国会内での発言の類似度(あるいは差別化度)を測定することで、連立政権に関わる比較議会論的な検討を進めた。まもなく、国際的なジャーナルに投稿する予定である。 また、国会における議員の発言活動パターンにおいて、与野党間にどのような特質があるのか、またそうした特質は選挙制度要因の影響(個人票誘因の大きさ)ということとどのような関係にあるのかを検討してペーパーを作成し、国際ジャーナルに投稿している。さらに、BERTを用いて、重要な議題・概念をめぐって国会でどのように討議されてきたのかを検証している。この課題は、日本の国会におけるアジェンダ・セッティングの問題がいかなるパターンとなっており、どのように特徴を持っているのかを浮き彫りにすることができる。 他方、Twitterの投稿情報をベースとして、アンケートを追加することでさらなる分析の準備も進めつつある。 さらに、注目を集めているChatGPTについても、活用が見込めるため、国会の議事録データを活用した積極的な取り組みを開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
概ね予定された進捗の状況にある。 国会での議員の発言に関するデータベースを活用し、与野党議員の発言パターンについて検討し、さらに、特に自民党議員と公明党議員との発言パターンを解析することで、連立政権における連立与党間での競合と対立のメカニズムについての論文を作成中である。これには、本研究メンバーではないものの、神戸大学の藤村直史教授にも参加してもらっている。 また、国会での発言データについてBertの発展モデルの1つを適用して解析し、国会でのアジェンダ・セッティングに関わる論文も作成している。 他方、Twitterの情報と組み合わせるための追加的なアンケート調査を実施した。今後、これらの情報を用いた本格的な分析を行う。 さらに、ChatGPTは我々の研究目的にも深い関連性があるので、これを活用すべく分析の準備を始めた。
|
Strategy for Future Research Activity |
今後は、これまでに得られたデータの一層の解析を通じて、それらをできるだけペーパーの形にまとめる作業のウェートが大きくなる。しかし一方で、ChatGPTの活用を始め、比較的新規の課題にも取り組む必要があり、またそれが持つ研究成果の可能性は大きなものがあると判断される。従って、いくつかの論文のとりまとめと並行しつつ、最新の言語モデルを活用した研究を継続させ、知見の集積を図ることにも取り組む。 可能ならば、これまではコロナの影響で進められなかった海外での研究集会への参加・発表などにも取り組みたい。
|
Report
(3 results)
Research Products
(6 results)