自然言語処理技術を用いた日英仏議会テキスト解析による国会の特質・変則性の解明
Project/Area Number |
20K20509
|
Research Category |
Grant-in-Aid for Challenging Research (Pioneering)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 6:Political science and related fields
|
Research Institution | Gakushuin University |
Principal Investigator |
野中 尚人 学習院大学, 法学部, 教授 (90264697)
|
Co-Investigator(Kenkyū-buntansha) |
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
狩野 芳伸 静岡大学, 情報学部, 准教授 (20506729)
三輪 洋文 学習院大学, 法学部, 教授 (20780258)
|
Project Period (FY) |
2020-07-30 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥20,800,000 (Direct Cost: ¥16,000,000、Indirect Cost: ¥4,800,000)
Fiscal Year 2023: ¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2022: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2021: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2020: ¥7,930,000 (Direct Cost: ¥6,100,000、Indirect Cost: ¥1,830,000)
|
Keywords | 自然言語処理 / 議会スピーチ / 比較議会論 / 国会 / Bert / SNS / 議会テキスト / 議会討論 / 画像処理 / 日英仏比較 / トピックモデル / 議会テキスト分析 / 議会データベース / 国会の特質 |
Outline of Research at the Start |
本研究では、申請代表者がこれまでに蓄積・データベース化してきた大量の議会(国会)審議記録のテキストを対象とし、自然言語処理の技術革新を取り込むことによって新しい融合的な実証研究を展開し、それによって比較議会論から見た国会研究の水準とその理解を飛躍的に高めることを目指す。 こうした作業によって、国会での議員間「討論」や与野党間関係に関わるいくつかの重要な特質が比較議会論的な見地から明らかになる。
|
Outline of Annual Research Achievements |
本年度は研究プロジェクトの最終年度であるが、コロナ感染症の影響がようやく低減したため、対面での研究会合や学会等での発表などの機会も元通りとなってきた。以下のような研究活動と業績の発表を行った。 第1に、衆議院と参議院での国会発言に関するデータベースの作成はかなり進捗し、参議院に関しては細部の調整は残っているものの、概ね完成形に近づけることができた。 第2に、こうして整備されたデータベースを活用することで、国会での議員の発言の特質について、特に自民党議員と公明党議員との発言パターンを解析することで、連立政権における連立与党間での競合と対立のメカニズムについての論文を作成した。これには、本研究メンバーではないものの、神戸大学の藤村直史教授にも参加してもらっている。2023年度末までに、国際的なジャーナルへの2回の投稿を通じて論文としての完成度を上げ、審査結果を待っている。 第3に、国会での発言パターンは、欧米の標準的な議院内閣制の国におけるパターンと比較した場合、あるいは、近年の有力な理論モデルに準拠した場合に、かなり強い変則性を持っているが、それがどのような理由と経緯で形成されてきたのかについて、スピーチの定量分析と定性的な分析を組み合わせることで、これを論じるペーパーを作成した。このうちの1つは、Party Politics誌に採択された。またもう1つのペーパーもほぼ完成し、最終的な投稿段階にある。 他方、X(旧Twitter)の投稿情報をベースとして、アンケートを追加することでさらなる分析の準備も進めてきたが、これについてはもう少し時間をかけながら進める必要がある。 また、BERTなどのモデルに代わって、ChatGPTやClaude, Llama などの生成系の大規模言語モデルが登場したため、これらの活用方法を精査し、出来る限り十分な成果を得るために、研究期間を1年延長した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2023年度は最終年度であるため、とりまとめに向けた作業を精力的に続けてきた。これによって、衆議院・参議院の両院について、そのデータベースの作成についてはかなり進展し、細部を除けばほぼ完成した状態に近づいた。 また、これらのデータ・ベースの解析と、自然言語処理技術を組み合わせることで、自民党と公明党による連立政権の中で、国会でのスピーチがどのように行われるのかについてのペーパーを作成した。連立政権におけるジュニア・パートナー政党が、連立相手の主要政党との間どのような協力・競合と差別化の行動をとるのかを分析した。 また、国会での全体的な変則的な発言パターンに関わる研究としては、スピーチの定量分析と定性的な分析を組み合わせるというアプローチを採って進めてきた。1つは、Party Politics誌に採択された。もう1つは、2度めの投稿をする段階にある。論文の完成度はかなり上がっていると考えられるが、当初予定よりも時間がかかり、最終結果はまだ出ていない。 他方、X(旧Twitter)の投稿をベースとして、さらにアンケートで追加情報を取得する方法での研究も進めてきたが、X(旧Twitter)社の突然の方針転換で、当初の想定に比べ難しい作業が必要となった。 さらに、大規模言語モデルに関しても、生成系の高性能のモデルが続々と登場し、先端的な分析を実行するためにはどれをどのように用いるのが良いか、改めて一定の時間をかけた予備的な検討が必要となった。 こうした事情により、期間を延長し、万全を期してよりよい成果を得られるようにすることが望ましいと判断し、研究期間を1年延長することとした。
|
Strategy for Future Research Activity |
本来の予定期間を超えて研究を継続するので、出来る限りの成果を得られるように努力する。 まず、これまで検討し、ペーパーの作成に取り組んでいる課題について、最終的な成果を確定させるように引き続き努力する。1つは自公連立政権において連立を組んでいる政党間でどのような協力・競合・差別化の動きがあり、それが国会でのスピーチにいかなる影響を与えているのかを論じている。かなりの完成度になっていると信じるが、なお、査読結果を踏まえて出来るだけの対応を行う。もう1つのペーパーは、2度目の投稿に向けて最終段階にあり、これも同じように最終的な結果を得られるまで引き続き注力する。 他方、期間延長の原因として、生成系の新しい大規模言語モデルが登場したことがあるが、期間延長によって大変に重要な機会が得られたので、これを用いた議会スピーチ分析をぜひともまとめるところまで努力したい。 また、英仏との比較についても、少なくとも第一段階として議会討議・スピーチのパターン(特にスピーチ・シーケンス)戦前から現在までの長期的な歴史的形成パターンを比較することで、国会の特質を浮かび上がらせる作業に取り組む。これは、日本において議院内閣制がどのように発展・定着した来たのかを比較的な観点から考察する上で重要な情報を提供する見込みである。 これらの作業を積み上げることで、日本の国会についての特質、その変則性を明らかにするという初期の目的の達成に出来るだけ近づく。
|
Report
(4 results)
Research Products
(25 results)