研究課題/領域番号 |
20K20509
|
研究機関 | 学習院大学 |
研究代表者 |
野中 尚人 学習院大学, 法学部, 教授 (90264697)
|
研究分担者 |
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
狩野 芳伸 静岡大学, 情報学部, 准教授 (20506729)
三輪 洋文 学習院大学, 法学部, 准教授 (20780258)
|
研究期間 (年度) |
2020-07-30 – 2024-03-31
|
キーワード | 自然言語処理 / 議会テキスト / 議会討論 / 国会 / Bert / SNS |
研究実績の概要 |
本年度は研究プロジェクトの第3年度であったが、コロナ感染症の影響が続いたため、対面での研究会合や学会等への出席などにはやや不利な条件が続いたが、年度の最後のところからは、対面での研究会に切り替えた。Zoomによってもかなりの効果が獲得できたが、対面での会議もいろいろと異なる役割があることも確認できた。 本研究では、自然言語処理技術を用いる上で、そのためのデータセットの構築が極めて重要であるが、それについてはかなりの進展が達成できた。1つは、国会議員の国会での発言活動について、衆議院分のデータ・ベースからさらに抽出したデータ・セットを構築し、それを用いて連立政党間(自民党と公明党の間)での発言の傾向を分析する作業を進めた。政党・内閣への支持の推移に加えて、自然言語処理の手法を用いて、国会内での発言の類似度(あるいは差別化度)を測定することで、連立政権に関わる比較議会論的な検討を進めた。まもなく、国際的なジャーナルに投稿する予定である。 また、国会における議員の発言活動パターンにおいて、与野党間にどのような特質があるのか、またそうした特質は選挙制度要因の影響(個人票誘因の大きさ)ということとどのような関係にあるのかを検討してペーパーを作成し、国際ジャーナルに投稿している。さらに、BERTを用いて、重要な議題・概念をめぐって国会でどのように討議されてきたのかを検証している。この課題は、日本の国会におけるアジェンダ・セッティングの問題がいかなるパターンとなっており、どのように特徴を持っているのかを浮き彫りにすることができる。 他方、Twitterの投稿情報をベースとして、アンケートを追加することでさらなる分析の準備も進めつつある。 さらに、注目を集めているChatGPTについても、活用が見込めるため、国会の議事録データを活用した積極的な取り組みを開始した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
概ね予定された進捗の状況にある。 国会での議員の発言に関するデータベースを活用し、与野党議員の発言パターンについて検討し、さらに、特に自民党議員と公明党議員との発言パターンを解析することで、連立政権における連立与党間での競合と対立のメカニズムについての論文を作成中である。これには、本研究メンバーではないものの、神戸大学の藤村直史教授にも参加してもらっている。 また、国会での発言データについてBertの発展モデルの1つを適用して解析し、国会でのアジェンダ・セッティングに関わる論文も作成している。 他方、Twitterの情報と組み合わせるための追加的なアンケート調査を実施した。今後、これらの情報を用いた本格的な分析を行う。 さらに、ChatGPTは我々の研究目的にも深い関連性があるので、これを活用すべく分析の準備を始めた。
|
今後の研究の推進方策 |
今後は、これまでに得られたデータの一層の解析を通じて、それらをできるだけペーパーの形にまとめる作業のウェートが大きくなる。しかし一方で、ChatGPTの活用を始め、比較的新規の課題にも取り組む必要があり、またそれが持つ研究成果の可能性は大きなものがあると判断される。従って、いくつかの論文のとりまとめと並行しつつ、最新の言語モデルを活用した研究を継続させ、知見の集積を図ることにも取り組む。 可能ならば、これまではコロナの影響で進められなかった海外での研究集会への参加・発表などにも取り組みたい。
|
次年度使用額が生じた理由 |
海外での研究大会への参加・発表に関して、コロナの影響が深刻で実施できないままに推移してきた。今年度はこれを積極的に実行するとともに、ChatGPTのAPI活用や、Twitterに関連したアンケート調査にもかなりの資金を投入する予定である。
|