研究課題/領域番号 |
20K20509
|
研究機関 | 学習院大学 |
研究代表者 |
野中 尚人 学習院大学, 法学部, 教授 (90264697)
|
研究分担者 |
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
狩野 芳伸 静岡大学, 情報学部, 准教授 (20506729)
三輪 洋文 学習院大学, 法学部, 教授 (20780258)
|
研究期間 (年度) |
2020-07-30 – 2025-03-31
|
キーワード | 自然言語処理 / 議会スピーチ / 比較議会論 / 国会 / Bert / SNS |
研究実績の概要 |
本年度は研究プロジェクトの最終年度であるが、コロナ感染症の影響がようやく低減したため、対面での研究会合や学会等での発表などの機会も元通りとなってきた。以下のような研究活動と業績の発表を行った。 第1に、衆議院と参議院での国会発言に関するデータベースの作成はかなり進捗し、参議院に関しては細部の調整は残っているものの、概ね完成形に近づけることができた。 第2に、こうして整備されたデータベースを活用することで、国会での議員の発言の特質について、特に自民党議員と公明党議員との発言パターンを解析することで、連立政権における連立与党間での競合と対立のメカニズムについての論文を作成した。これには、本研究メンバーではないものの、神戸大学の藤村直史教授にも参加してもらっている。2023年度末までに、国際的なジャーナルへの2回の投稿を通じて論文としての完成度を上げ、審査結果を待っている。 第3に、国会での発言パターンは、欧米の標準的な議院内閣制の国におけるパターンと比較した場合、あるいは、近年の有力な理論モデルに準拠した場合に、かなり強い変則性を持っているが、それがどのような理由と経緯で形成されてきたのかについて、スピーチの定量分析と定性的な分析を組み合わせることで、これを論じるペーパーを作成した。このうちの1つは、Party Politics誌に採択された。またもう1つのペーパーもほぼ完成し、最終的な投稿段階にある。 他方、X(旧Twitter)の投稿情報をベースとして、アンケートを追加することでさらなる分析の準備も進めてきたが、これについてはもう少し時間をかけながら進める必要がある。 また、BERTなどのモデルに代わって、ChatGPTやClaude, Llama などの生成系の大規模言語モデルが登場したため、これらの活用方法を精査し、出来る限り十分な成果を得るために、研究期間を1年延長した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2023年度は最終年度であるため、とりまとめに向けた作業を精力的に続けてきた。これによって、衆議院・参議院の両院について、そのデータベースの作成についてはかなり進展し、細部を除けばほぼ完成した状態に近づいた。 また、これらのデータ・ベースの解析と、自然言語処理技術を組み合わせることで、自民党と公明党による連立政権の中で、国会でのスピーチがどのように行われるのかについてのペーパーを作成した。連立政権におけるジュニア・パートナー政党が、連立相手の主要政党との間どのような協力・競合と差別化の行動をとるのかを分析した。 また、国会での全体的な変則的な発言パターンに関わる研究としては、スピーチの定量分析と定性的な分析を組み合わせるというアプローチを採って進めてきた。1つは、Party Politics誌に採択された。もう1つは、2度めの投稿をする段階にある。論文の完成度はかなり上がっていると考えられるが、当初予定よりも時間がかかり、最終結果はまだ出ていない。 他方、X(旧Twitter)の投稿をベースとして、さらにアンケートで追加情報を取得する方法での研究も進めてきたが、X(旧Twitter)社の突然の方針転換で、当初の想定に比べ難しい作業が必要となった。 さらに、大規模言語モデルに関しても、生成系の高性能のモデルが続々と登場し、先端的な分析を実行するためにはどれをどのように用いるのが良いか、改めて一定の時間をかけた予備的な検討が必要となった。 こうした事情により、期間を延長し、万全を期してよりよい成果を得られるようにすることが望ましいと判断し、研究期間を1年延長することとした。
|
今後の研究の推進方策 |
本来の予定期間を超えて研究を継続するので、出来る限りの成果を得られるように努力する。 まず、これまで検討し、ペーパーの作成に取り組んでいる課題について、最終的な成果を確定させるように引き続き努力する。1つは自公連立政権において連立を組んでいる政党間でどのような協力・競合・差別化の動きがあり、それが国会でのスピーチにいかなる影響を与えているのかを論じている。かなりの完成度になっていると信じるが、なお、査読結果を踏まえて出来るだけの対応を行う。もう1つのペーパーは、2度目の投稿に向けて最終段階にあり、これも同じように最終的な結果を得られるまで引き続き注力する。 他方、期間延長の原因として、生成系の新しい大規模言語モデルが登場したことがあるが、期間延長によって大変に重要な機会が得られたので、これを用いた議会スピーチ分析をぜひともまとめるところまで努力したい。 また、英仏との比較についても、少なくとも第一段階として議会討議・スピーチのパターン(特にスピーチ・シーケンス)戦前から現在までの長期的な歴史的形成パターンを比較することで、国会の特質を浮かび上がらせる作業に取り組む。これは、日本において議院内閣制がどのように発展・定着した来たのかを比較的な観点から考察する上で重要な情報を提供する見込みである。 これらの作業を積み上げることで、日本の国会についての特質、その変則性を明らかにするという初期の目的の達成に出来るだけ近づく。
|
次年度使用額が生じた理由 |
次年度使用が必要となった理由は、コロナへの対応でやや進捗が遅れたのち、Bert, Reberta等のモデルに代わってChatGPTをはじめとした生成系のAIモデルが登場し、それらの活用へと切り替えるために様々な追加の検討と対応が必要になったためである。 現在、生成系AIの複数のモデルを使って、具体的な作業の進め方を検討している。現在、主としてChatGPTとClaudeのパフォーマンス比較を行った上で、実際の作業の手順を確認しているが、一旦それを決定した後は、大量のデータ処理が必要になる。恐らく、残余の予算の三分の二ほどはこれに投入することになる。必要額を事前に正確に特定するのは困難で、プロンプト(計算に際しての指示)によって費用が大きく変動するためである。そのため、実験的な施行をすでに複数回にわたって行っているが、なお慎重に貴重な研究資金を有効に活用するための検討を行っている。この作業には、英文テキストと日本語テキストの両方を比較するための作業も含まれる。 また、自公連立政権における与党間関係のスピーチ分析と、国会スピーチにおける全体的な変則的パターンについて検討したペーパーが最終段階にあり、その投稿以降の様々な仕上げの作業にも種々の費用(英文校正、掲載費等)が見込まれる。
|