• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実績報告書

地方議会における非構造化データと構造化データの有機的な連結に関する研究

研究課題

研究課題/領域番号 21H03769
配分区分補助金
研究機関小樽商科大学

研究代表者

木村 泰知  小樽商科大学, 商学部, 教授 (50400073)

研究分担者 川浦 昭彦  同志社大学, 政策学部, 教授 (10271610)
乙武 北斗  福岡大学, 工学部, 助教 (20580179)
佐々木 稔  茨城大学, 理工学研究科(工学野), 准教授 (60344834)
高丸 圭一  宇都宮共和大学, シティライフ学部, 教授 (60383121)
小川 泰弘  名古屋大学, 情報基盤センター, 准教授 (70332707)
内田 ゆず  北海学園大学, 工学部, 教授 (80583575)
研究期間 (年度) 2021-04-01 – 2025-03-31
キーワード地方議会会議録 / 構造化データ / 非構造化データ / コーパス / データセット
研究実績の概要

本研究では、地方議会会議録(非構造データ)を基盤として、さまざまな構造化データを結びつける「拡張版 地方議会会議録コーパス」を構築するとともに、本コーパスを用いて、政治学、経済学、社会言語学、言語処理の研究を推進することを目的としている。
本年度は、議論構造の分析、および、関連文書の自動アライメントについての研究を進めた。研究代表者、および、研究分担者は、地方議会会議録、議会だより、予算表などのデータを用いた Shared Task ( QA Lab-PoliInfo-3 ) を開催した。QA Lab-PoliInfo-3には、大学や民間企業などから13チームの参加があった。データセットについては、GitHub ( https://github.com/poliinfo3 ) 上で公開した。
また、2022年7月から2023年12月までの期間に実施される評価型ワークショップのNTCIR17に、政治情報を対象としたQA-Lab PoliInfo4タスク、および、有価証券報告書のテキストと表を扱うUFOタスクが採択された。QA-Lab PoliInfo4は、議会会議録を活用した4つのサブタスク(ファクトチェック、質問応答、スタンス分類、関係抽出)を提案した。UFOタスクでは、有価証券報告書に含まれる非構造化データを半構造化データへ変換するタスクを提案した。これらのタスクの詳細は、ウェブサイト( https://sites.google.com/view/poliinfo4/ 、https://sites.google.com/view/ntcir17-ufo/ )
により公開している。
他にも、政治学、経済学、社会言語学における研究に向けて、地方議会会議録のデータの収集および整理を進めている。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

NTCIR16 QA Lab-PoliInfo-3 の Budget Argument Mining タスクにおいて、地方議会会議録(非構造化データ)を基盤として予算表(構造化データ)と結びつけるデータセットを構築した。また、経済学の研究では、議会会議録と選挙結果を用いた分析を進めた。さらに、日本経済評論社から書籍「自治体DX推進とオープンデータの活用」を出版した。

研究代表者、および、研究分担者は、地方議会会議録、議会だより、予算表などのデータを用いた Shared Task ( QA Lab-PoliInfo-3 ) を開催した。QA Lab-PoliInfo-3には、大学や民間企業などから13チームの参加があった。 この Shared Task に関する研究発表を研究会で行うとともに、結果をまとめて国際会議 LREC2022へ投稿した。データセットについては、GitHub ( https://github.com/poliinfo3 ) 上で公開した。

このことから、おおむね順調に進展しているといえる。

今後の研究の推進方策

本年度は、政治情報に関するNTICR-17 PoliInfo-4 タスク 、および、有価証券報告書に関する NTICR-17 UFO タスクを開催する。 PoliInfo-4 は、4つのサブタスクからなる議会会議録を対象としたタスクである。4つのサブタスクのなかでMinutes to Budget Linking (以下 MBLink)は、本研究課題に最も関連しており、議会における予算関連の発言(非構造化データ)を対象として、発言に関連する予算表をみつけることを目的としている。 また、NTICR-17 UFOは、有価証券報告書のテキストと表を対象としたタスクである。このタスクも、MBLink と同様に、本研究課題に関連しており、非構造化データと構造化データの連結を目的としたタスクである。申請者は、「拡張版 地方議会会議録コーパス」を活用して、これらのタスクのデータセットを構築するとともに、公開することで、政治学、経済学、社会言語学、言語処理の研究を推進する。

  • 研究成果

    (11件)

すべて 2023 2022

すべて 学会発表 (11件) (うち国際学会 3件)

  • [学会発表] 議会会議録と予算表を紐づけるMinutes-to-Budget Linkingタスクの提案2023

    • 著者名/発表者名
      木村泰知, 梶縁, 乙武北斗, 門脇一真, 佐々木稔, 小林暁雄
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
  • [学会発表] NTCIR-17 QA Lab-PoliInfo-4 Answer VerificationにおけるGDADCの利用に向けての考察2023

    • 著者名/発表者名
      渋木英潔, BESNA, 内田ゆず, 小川泰弘, 門脇一真, 木村泰知
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
  • [学会発表] 地方議会における議案への賛否に関する発言の分析 ―NTCIR-17 QA Lab-PoliInfo4 Stance Classification-2タスクに向けて―2023

    • 著者名/発表者名
      高丸圭一, 内田ゆず, 木村泰知, 秋葉友良
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
  • [学会発表] 地方議会議事録を対象としたスタンス分類データセットの自動構築とベースライン分類器の評価2023

    • 著者名/発表者名
      我藤勇樹, 秋葉友良, 内田ゆず, 木村泰知, 高丸圭一
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
  • [学会発表] NTCIR-17 QA Lab-PoliInfo-4 のタスク設計2023

    • 著者名/発表者名
      小川泰弘, 木村泰知, 渋木英潔, SNA, 乙武北斗, 内田ゆず, 高丸圭一, 門脇一真, 秋葉友良, 佐々木稔, 小林暁雄
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
  • [学会発表] Budget Argument Mining Dataset Using Japanese Minutes from the National Diet and Local Assemblies2022

    • 著者名/発表者名
      Yasutomo Kimura, Hokuto Ototake, Minoru Sasaki
    • 学会等名
      LREC 2022
    • 国際学会
  • [学会発表] 地方自治体の予算を対象にした金額表現の分析2022

    • 著者名/発表者名
      梶 縁, 木村 泰知
    • 学会等名
      第38回ファジィシステムシンポジウム(FSS2022)
  • [学会発表] 国会会議録を用いた事前学習済みELECTRAの構築と政治ドメインのタスクによる検証2022

    • 著者名/発表者名
      永渕 景祐, 木村 泰知, 荒木 健治
    • 学会等名
      情報処理学会 第21回情報科学技術フォーラム(FIT2022)
  • [学会発表] BERTベース分類器とSHAPによる地方議会会議録における特徴表現抽出の試み2022

    • 著者名/発表者名
      乙武 北斗, 高丸 圭一, 内田 ゆず, 木村 泰知
    • 学会等名
      人工知能学会全国大会論文集 第36回全国大会 (2022)
  • [学会発表] OUC at the NTCIR-16 QA Lab-PoliInfo-3 Budget Argument Mining2022

    • 著者名/発表者名
      Keiyu Nagafuchi, Rin Sasaki, Seiya Oki, Yasutomo Kimura, Kenji Araki
    • 学会等名
      The 16th NTCIR Conference Evaluation of Information Access Technologies
    • 国際学会
  • [学会発表] Overview of the NTCIR-16 QA Lab-PoliInfo-3 Task2022

    • 著者名/発表者名
      Yasutomo Kimura, Hideyuki Shibuki, Hokuto Ototake, Yuzu Uchida, Keiichi Takamaru, Madoka Ishioroshi, Kazuma Kadowaki, Masaharu Yoshioka, Tomoyosi Akiba, Yasuhiro Ogawa, Minoru Sasaki, Ken-Ichi Yokote, Tatsunori Mori, Kenji Araki, Teruko Mitamura, Satoshi Sekine
    • 学会等名
      The 16th NTCIR Conference Evaluation of Information Access Technologies
    • 国際学会

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi