研究課題/領域番号 |
20K20509
|
研究機関 | 学習院大学 |
研究代表者 |
野中 尚人 学習院大学, 法学部, 教授 (90264697)
|
研究分担者 |
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
狩野 芳伸 静岡大学, 情報学部, 准教授 (20506729)
三輪 洋文 学習院大学, 法学部, 准教授 (20780258)
|
研究期間 (年度) |
2020-07-30 – 2024-03-31
|
キーワード | 国会 / 議会テキスト / 自然言語処理 / 日英仏比較 / トピックモデル |
研究実績の概要 |
本研究の目的は、自然言語処理技術を用いて、議事録に記録されている法案審議記録などの議会のテキストを分析し、日本の国会の特質を解明することである。自然言語処理の手法は急速に進展しつつあり、コンピュータ・サイエンスの分野での研究成果をも取り入れつつ、様々な手法と角度から分析することに取り組む。これらの研究を他の主要な国々との比較を通じて行うことで、比較的な観点から見た国会の特質はより鮮明にされると考えられる。 また、本研究は、より広い意味での社会科学の方法論における新しい展開を試みるものでもある。テキストを用いた新しいデータ・セットの構築も進められるため、様々な新しい仮説の提示と検証が可能になることが期待できる。 第1年度である2020年度には、研究手法についての情報共有とそれに関わる意見交換、ならびにいくつかのデータについての整備の可能性とその段取りを検討し、いくつかもものについては実際に整備が進んでいる。1つは、衆議院についてのデータベースであり、発言テキスト、発言者の氏名、肩書、所属政党、さらに発言者カテゴリーを付している。これは既に本研究がスタートする時点でほぼ出来上がっていたが、様々な微調整と修正を行った上で、具体的な分析への使用を開始している。このデータベースについては、適切なタイミングで公開される予定である。また、国会 (衆参両院)の映像情報のデータベース化も進めており、既に基礎的なデータの収集は終えている。 これらのデータ収集・作成と並行して、具体的な研究項目についての作業も進めつつある。1つは、Proksch & Slapinのdelegation model of parliamentary speech 論の妥当性を考察する研究である。また、テキストデータの用いて質疑のやり取りのパターン、その質に関わる分析を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
基本的なデータベースの構築は予定通り進んでおり、また映像データという新しい可能性にも既に取り組むことが開始できた。データベースの構築については、イギリスの下院についても、その作業を済めつつある。 また、データベースを基礎として、仮説検定のためのデータ・セットを(国会議員のイデオロギー位置の情報を加えて)作成し、分析・検討をすすめつつある。 さらに、国会議員の質問の質的な分析として、データベースからの情報を基にして研究を進めつつある。 また、選挙予測に関わる大規模な予測モデルの可能性についても検討をしている。
|
今後の研究の推進方策 |
まず本年度は、データベースの構築作業をさらに進めることが重要となる。日本の参議院とイギリスの下院がまず目標となる。 また、テキストデータの活用に向けて、機械学習用の正解ラベルの作成などの作業も進める必要がある。また、映像データとテキストデータのひもづけ、さらに映像データそのものの精密な解析を可能とするための取り組みも進める。 他方で、分析結果の発表にも取り組んで行く。まず第1弾として、Proksch & Slapinのdelegation model of parliamentary speech 論の妥当性をめぐる検証論文を発表する予定である。
|
次年度使用額が生じた理由 |
新型コロナ感染症の拡大に伴い、海外・国内の出張が全くできなかったことに加え、アルバイトを用いた作業を進めることに極めて大きな困難が生じたため。 今年度は、その遅れを取り戻すことができると想定している。
|