2023 年度実施状況報告書

自然言語処理技術を用いた日英仏議会テキスト解析による国会の特質・変則性の解明

研究課題

研究課題/領域番号	20K20509
研究機関	学習院大学
研究代表者	野中尚人学習院大学, 法学部, 教授 (90264697)
研究分担者	久保山哲二学習院大学, 付置研究所, 教授 (80302660) 狩野芳伸静岡大学, 情報学部, 准教授 (20506729) 三輪洋文学習院大学, 法学部, 教授 (20780258)
研究期間 (年度)	2020-07-30 – 2025-03-31
キーワード	自然言語処理 / 議会スピーチ / 比較議会論 / 国会 / Bert / SNS
研究実績の概要	本年度は研究プロジェクトの最終年度であるが、コロナ感染症の影響がようやく低減したため、対面での研究会合や学会等での発表などの機会も元通りとなってきた。以下のような研究活動と業績の発表を行った。第1に、衆議院と参議院での国会発言に関するデータベースの作成はかなり進捗し、参議院に関しては細部の調整は残っているものの、概ね完成形に近づけることができた。第2に、こうして整備されたデータベースを活用することで、国会での議員の発言の特質について、特に自民党議員と公明党議員との発言パターンを解析することで、連立政権における連立与党間での競合と対立のメカニズムについての論文を作成した。これには、本研究メンバーではないものの、神戸大学の藤村直史教授にも参加してもらっている。2023年度末までに、国際的なジャーナルへの2回の投稿を通じて論文としての完成度を上げ、審査結果を待っている。第3に、国会での発言パターンは、欧米の標準的な議院内閣制の国におけるパターンと比較した場合、あるいは、近年の有力な理論モデルに準拠した場合に、かなり強い変則性を持っているが、それがどのような理由と経緯で形成されてきたのかについて、スピーチの定量分析と定性的な分析を組み合わせることで、これを論じるペーパーを作成した。このうちの1つは、Party Politics誌に採択された。またもう1つのペーパーもほぼ完成し、最終的な投稿段階にある。他方、X(旧Twitter)の投稿情報をベースとして、アンケートを追加することでさらなる分析の準備も進めてきたが、これについてはもう少し時間をかけながら進める必要がある。また、BERTなどのモデルに代わって、ChatGPTやClaude, Llama などの生成系の大規模言語モデルが登場したため、これらの活用方法を精査し、出来る限り十分な成果を得るために、研究期間を1年延長した。
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由 2023年度は最終年度であるため、とりまとめに向けた作業を精力的に続けてきた。これによって、衆議院・参議院の両院について、そのデータベースの作成についてはかなり進展し、細部を除けばほぼ完成した状態に近づいた。また、これらのデータ・ベースの解析と、自然言語処理技術を組み合わせることで、自民党と公明党による連立政権の中で、国会でのスピーチがどのように行われるのかについてのペーパーを作成した。連立政権におけるジュニア・パートナー政党が、連立相手の主要政党との間どのような協力・競合と差別化の行動をとるのかを分析した。また、国会での全体的な変則的な発言パターンに関わる研究としては、スピーチの定量分析と定性的な分析を組み合わせるというアプローチを採って進めてきた。1つは、Party Politics誌に採択された。もう1つは、2度めの投稿をする段階にある。論文の完成度はかなり上がっていると考えられるが、当初予定よりも時間がかかり、最終結果はまだ出ていない。他方、X(旧Twitter)の投稿をベースとして、さらにアンケートで追加情報を取得する方法での研究も進めてきたが、X(旧Twitter)社の突然の方針転換で、当初の想定に比べ難しい作業が必要となった。さらに、大規模言語モデルに関しても、生成系の高性能のモデルが続々と登場し、先端的な分析を実行するためにはどれをどのように用いるのが良いか、改めて一定の時間をかけた予備的な検討が必要となった。こうした事情により、期間を延長し、万全を期してよりよい成果を得られるようにすることが望ましいと判断し、研究期間を1年延長することとした。
今後の研究の推進方策	本来の予定期間を超えて研究を継続するので、出来る限りの成果を得られるように努力する。まず、これまで検討し、ペーパーの作成に取り組んでいる課題について、最終的な成果を確定させるように引き続き努力する。1つは自公連立政権において連立を組んでいる政党間でどのような協力・競合・差別化の動きがあり、それが国会でのスピーチにいかなる影響を与えているのかを論じている。かなりの完成度になっていると信じるが、なお、査読結果を踏まえて出来るだけの対応を行う。もう1つのペーパーは、2度目の投稿に向けて最終段階にあり、これも同じように最終的な結果を得られるまで引き続き注力する。他方、期間延長の原因として、生成系の新しい大規模言語モデルが登場したことがあるが、期間延長によって大変に重要な機会が得られたので、これを用いた議会スピーチ分析をぜひともまとめるところまで努力したい。また、英仏との比較についても、少なくとも第一段階として議会討議・スピーチのパターン(特にスピーチ・シーケンス)戦前から現在までの長期的な歴史的形成パターンを比較することで、国会の特質を浮かび上がらせる作業に取り組む。これは、日本において議院内閣制がどのように発展・定着した来たのかを比較的な観点から考察する上で重要な情報を提供する見込みである。これらの作業を積み上げることで、日本の国会についての特質、その変則性を明らかにするという初期の目的の達成に出来るだけ近づく。
次年度使用額が生じた理由	次年度使用が必要となった理由は、コロナへの対応でやや進捗が遅れたのち、Bert, Reberta等のモデルに代わってChatGPTをはじめとした生成系のAIモデルが登場し、それらの活用へと切り替えるために様々な追加の検討と対応が必要になったためである。現在、生成系AIの複数のモデルを使って、具体的な作業の進め方を検討している。現在、主としてChatGPTとClaudeのパフォーマンス比較を行った上で、実際の作業の手順を確認しているが、一旦それを決定した後は、大量のデータ処理が必要になる。恐らく、残余の予算の三分の二ほどはこれに投入することになる。必要額を事前に正確に特定するのは困難で、プロンプト(計算に際しての指示)によって費用が大きく変動するためである。そのため、実験的な施行をすでに複数回にわたって行っているが、なお慎重に貴重な研究資金を有効に活用するための検討を行っている。この作業には、英文テキストと日本語テキストの両方を比較するための作業も含まれる。また、自公連立政権における与党間関係のスピーチ分析と、国会スピーチにおける全体的な変則的パターンについて検討したペーパーが最終段階にあり、その投稿以降の様々な仕上げの作業にも種々の費用(英文校正、掲載費等)が見込まれる。

研究成果
(19件)

すべて 2024 2023

すべて雑誌論文 (11件) (うち国際共著 2件、査読あり 9件、オープンアクセス 3件) 学会発表 (8件) (うち国際学会 2件)

[雑誌論文] Fast Filtering for Similarity Search Using Conjunctive Enumeration of Sketches in Order of Hamming Distance2024
- 著者名/発表者名
  N. Higuchi, Y. Imamura, V. Mic, T. Shinohara, K. Hirata, T. Kuboyama
- 雑誌名
  
  International Conference on Pattern Recognition Applications and Methods (ICPRAM)
  
  巻: - ページ: 499-510
- DOI
  10.5220/0012322700003654
- 査読あり / オープンアクセス
[雑誌論文] ガラパゴス化した国会の改革2024
- 著者名/発表者名
  野中尚人
- 雑誌名
  
  学士会会報
  
  巻: 964 ページ: 43-47
[雑誌論文] DCZAR: ゼロ照応解析に基づく項省略補完による対話応答生成2024
- 著者名/発表者名
  上山彩夏, 狩野芳伸
- 雑誌名
  
  人工知能学会誌
  
  巻: 39巻3号ページ: -
- 査読あり
[雑誌論文] Overview and Discussion of the Competition on Legal Information, Extraction/Entailment2024
- 著者名/発表者名
  Randy Goebel, Yoshinobu Kano et al.
- 雑誌名
  
  The Review of Socionetwork Strategies
  
  巻: COLIEE 2023 ページ: -
- DOI
  10.1007/s12626-023-00152-0
- 査読あり / 国際共著
[雑誌論文] Party Theory of Parliamentary Debate and the Endogenous Nature of Parliamentary Institutions: Theoretical Implications from Japan’s Diet2023
- 著者名/発表者名
  Naoto Nonaka and Hirofumi Miwa
- 雑誌名
  
  Party Politics
  
  巻: - ページ: 1-11
- DOI
  10.1177/13540688231195197
- 査読あり / オープンアクセス
[雑誌論文] イデオロギーをどう測定するか2023
- 著者名/発表者名
  三輪洋文
- 雑誌名
  
  三色旗
  
  巻: 847 ページ: 3-10
[雑誌論文] ObstructionからNegative Agenda Powerへ－一党優位体制下の戦後国会において野党が獲得した影響力の本質2023
- 著者名/発表者名
  野中尚人
- 雑誌名
  
  学習院大学法学会雑誌
  
  巻: 59巻1号ページ: 173-202
- 査読あり
[雑誌論文] 編集距離と進化的学習を利用した特徴的なワイルドカード付きタグ木パターンの獲得2023
- 著者名/発表者名
  丹睦月,宮原哲浩,鈴木祐介,久保山哲二,内田智之
- 雑誌名
  
  人工知能学会全国大会論文集
  
  巻: - ページ: 1-3
- DOI
  10.11517/pjsai.jsai2023.0_2a1gs202
- 査読あり / オープンアクセス
[雑誌論文] Contribution Analysis of Large Language Models and Data Augmentations in Solving Legal Bar Examination2023
- 著者名/発表者名
  Takaaki Onaga, Masaki Fujita, Yoshinobu Kano
- 雑誌名
  
  Review of Socionetwork Strategies
  
  巻: COLIEE 2023 ページ: -
- DOI
  10.1007/s12626-024-00155-5
- 査読あり
[雑誌論文] COLIEE 2022 Summary: Methods for Legal Document Retrieval and Entailment2023
- 著者名/発表者名
  Mi-Young Kim, Juliano Rabelo, Randy Goebel, Masaharu Yoshioka, Yoshinobu Kano et al.
- 雑誌名
  
  Lecture Notes in Computer Science
  
  巻: 13859 ページ: 51-67
- DOI
  10.1007/978-3-031-29168-5
- 査読あり / 国際共著
[雑誌論文] Legal Textual Entailment Using Ensemble of Rule-Based and BERT-Based Method with Data Augmentation by Related Article Generation2023
- 著者名/発表者名
  Masaki Fujita, Takaaki Onaga, Ayaka Ueyama, Yoshinobu Kano
- 雑誌名
  
  Lecture Notes in Computer Science
  
  巻: 13859 ページ: 138-153
- DOI
  10.1007/978-3-031-29168-5_10
- 査読あり
[学会発表] Exploring Disparities in Subjective Discrimination Assessments: A Comparative Vignette Experiment between Humans and ChatGPT2023
- 著者名/発表者名
  五十嵐彰・狩野芳伸・三輪洋文
- 学会等名
  計量・数理政治研究会2023年夏季集会
[学会発表] Dialogue Response Generation Using Completion of Omitted Predicate Arguments Based on Zero Anaphora Resolution2023
- 著者名/発表者名
  Ayaka Ueyama, Yoshinobu Kano
- 学会等名
  24th Meeting of the Special Interest Group on Discourse and Dialogue
- 国際学会
[学会発表] Japanese Legal Bar Problem Solver Focusing on Person Names2023
- 著者名/発表者名
  Takaaki Onaga, Masaki Fujita and Yoshinobu Kano
- 学会等名
  Workshop on International Conference on Artificial Intelligence and Law
[学会発表] KIS's Stance Classfication Model at the NTCIR-17 QA Lab-PoliInfo-42023
- 著者名/発表者名
  Akira Nakada and Yoshinobu Kano
- 学会等名
  NTCIR-17 conference
[学会発表] AIWolfDial 2023: Summary of Natural Language Division of 5th International AIWolf Contest2023
- 著者名/発表者名
  Yoshinobu Kano, Neo Watanabe, Kaito Kagaminuma et al.
- 学会等名
  The 16th International Natural Language Generation Conference
- 国際学会
[学会発表] 生成AIの可能性と限界2023
- 著者名/発表者名
  狩野芳伸
- 学会等名
  立命館シンポジウム「AI技術の応用と法的課題」
[学会発表] 機械学習による精神疾患の分類と有効的な特徴量についての検討2023
- 著者名/発表者名
  田中宏和、香月祥、中村啓伸、岸本泰士郎、狩野芳伸
- 学会等名
  2023年度人工知能学会全国大会
[学会発表] 新型コロナ感染症発生届の分析-記載における非効率と自然言語処理による解決への課題と展望2023
- 著者名/発表者名
  福本拓也、坂根亜美、村松俊平、五十嵐正尚、狩野芳伸、荒牧英治、堀口裕正、奥村貴史
- 学会等名
  2023年度人工知能学会全国大会

2023 年度 実施状況報告書

自然言語処理技術を用いた日英仏議会テキスト解析による国会の特質・変則性の解明

研究代表者

野中 尚人 学習院大学, 法学部, 教授 (90264697)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Fast Filtering for Similarity Search Using Conjunctive Enumeration of Sketches in Order of Hamming Distance2024

著者名/発表者名

雑誌名

DOI

[雑誌論文] ガラパゴス化した国会の改革2024

著者名/発表者名

雑誌名

[雑誌論文] DCZAR: ゼロ照応解析に基づく項省略補完による対話応答生成2024

著者名/発表者名

雑誌名

[雑誌論文] Overview and Discussion of the Competition on Legal Information, Extraction/Entailment2024

著者名/発表者名

雑誌名

DOI

[雑誌論文] Party Theory of Parliamentary Debate and the Endogenous Nature of Parliamentary Institutions: Theoretical Implications from Japan’s Diet2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] イデオロギーをどう測定するか2023

著者名/発表者名

雑誌名

[雑誌論文] ObstructionからNegative Agenda Powerへ －一党優位体制下の戦後国会において野党が獲得した影響力の本質2023

著者名/発表者名

雑誌名

[雑誌論文] 編集距離と進化的学習を利用した特徴的なワイルドカード付きタグ木パターンの獲得2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Contribution Analysis of Large Language Models and Data Augmentations in Solving Legal Bar Examination2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] COLIEE 2022 Summary: Methods for Legal Document Retrieval and Entailment2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Legal Textual Entailment Using Ensemble of Rule-Based and BERT-Based Method with Data Augmentation by Related Article Generation2023

著者名/発表者名

雑誌名

DOI

[学会発表] Exploring Disparities in Subjective Discrimination Assessments: A Comparative Vignette Experiment between Humans and ChatGPT2023

著者名/発表者名

学会等名

[学会発表] Dialogue Response Generation Using Completion of Omitted Predicate Arguments Based on Zero Anaphora Resolution2023

著者名/発表者名

学会等名

[学会発表] Japanese Legal Bar Problem Solver Focusing on Person Names2023

著者名/発表者名

学会等名

[学会発表] KIS's Stance Classfication Model at the NTCIR-17 QA Lab-PoliInfo-42023

著者名/発表者名

学会等名

[学会発表] AIWolfDial 2023: Summary of Natural Language Division of 5th International AIWolf Contest2023

著者名/発表者名

学会等名

[学会発表] 生成AIの可能性と限界2023

著者名/発表者名

学会等名

[学会発表] 機械学習による精神疾患の分類と有効的な特徴量についての検討2023

著者名/発表者名

学会等名

[学会発表] 新型コロナ感染症発生届の分析-記載における非効率と自然言語処理による解決への課題と展望2023

著者名/発表者名

学会等名

2023 年度実施状況報告書

野中尚人学習院大学, 法学部, 教授 (90264697)

[雑誌論文] ObstructionからNegative Agenda Powerへ－一党優位体制下の戦後国会において野党が獲得した影響力の本質2023