• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

地方議会における非構造化データと構造化データの有機的な連結に関する研究

研究課題

研究課題/領域番号 23K21841
補助金の研究課題番号 21H03769 (2021-2023)
研究種目

基盤研究(B)

配分区分基金 (2024)
補助金 (2021-2023)
応募区分一般
審査区分 小区分90020:図書館情報学および人文社会情報学関連
研究機関小樽商科大学

研究代表者

木村 泰知  小樽商科大学, 商学部, 教授 (50400073)

研究分担者 川浦 昭彦  同志社大学, 政策学部, 教授 (10271610)
乙武 北斗  福岡大学, 工学部, 助教 (20580179)
佐々木 稔  茨城大学, 理工学研究科(工学野), 准教授 (60344834)
高丸 圭一  宇都宮共和大学, シティライフ学部, 教授 (60383121)
湯淺 墾道  明治大学, ガバナンス研究科, 専任教授 (60389400)
小川 泰弘  名古屋市立大学, データサイエンス学部, 准教授 (70332707)
内田 ゆず  北海学園大学, 工学部, 教授 (80583575)
研究期間 (年度) 2021-04-01 – 2025-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
16,380千円 (直接経費: 12,600千円、間接経費: 3,780千円)
2024年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2023年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2021年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
キーワード地方議会会議録 / 構造化データ / 非構造化データ / データの連結 / データ連結 / 政治情報 / 予算表 / コーパス / データセット / Linked Data / 議論の構造
研究開始時の研究の概要

本研究では、地方議会会議録(非構造化データ)を基盤として、さまざまな構造化データと連結した「拡張版 地方議会会議録コーパス」を構築することで、政治学、経済学、社会言語学、言語処理の応用研究を推進する。本研究で行う研究項目は、以下の通りである。
①発言者の属性を整理し、政治的影響の検証を行う(政治学関連)
②発言内容と選挙結果を結びつけ、公共選択に関する分析を行う(経済学関連)
③発言文字列と発言音声を結びつけ、発話スタイルの変化を分析する(社会言語学関連)
④議論の構造に着目し、要約、分類、抽出に関する研究を行う(言語処理関連)

研究実績の概要

本研究では、地方議会会議録(非構造データ)を基盤として、さまざまな構造化データを結びつける「拡張版地方議会会議録コーパス」を構築するとともに、本コーパスを用いて、政治学、経済学、社会言語学、言語処理の研究を推進することを目的としている。

本年度は、議論構造の分析および関連する文書と表の自動アライメントについての研究を進めた。研究代表者および研究分担者は、地方議会会議録、議会だより、予算表などのデータを用いたQA-Lab PoliInfo4タスク、および有価証券報告書のテキストと表を扱うUFOタスクを実施した。QA-Lab PoliInfo4では、議会会議録を活用した4つのサブタスク(ファクトチェック、質問応答、スタンス分類、関係抽出)を提案した。UFOタスクでは、有価証券報告書に含まれる非構造化データを半構造化データへ変換するタスクを実施した。これらのタスクの詳細は、ウェブサイト(https://sites.google.com/view/poliinfo4/ および https://sites.google.com/view/ntcir17-ufo/)にて公開している。

また、政治学、経済学との研究成果を出しており、査読付き論文として採録された。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

NTCIR17 QA Lab-PoliInfo-4 の MBLink タスクにおいて、地方議会会議録(非構造化データ)を基盤として予算表(構造化データ)と紐づけるデータセットを構築した。また、UFOタスクでは、有価証券報告書に含まれる非構造化データを半構造化データへ変換するタスクを実施した。他にも、経済学の研究では、議会会議録と選挙結果を用いた分析を進め、論文投稿をした。

今後の研究の推進方策

今後は、Shared Tasks としてNTCIR-18 の有価証券報告書に関連タスクについての企画・運営を行っており、その結果を議会会議録にも応用する予定である。また、政治学、経済学、社会言語学における研究に向けて、地方議会会議録のデータの収集および整理を進めている。

報告書

(3件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 2021 実績報告書
  • 研究成果

    (34件)

すべて 2024 2023 2022 2021 その他

すべて 雑誌論文 (4件) (うち国際共著 1件、 査読あり 3件、 オープンアクセス 3件) 学会発表 (27件) (うち国際学会 4件、 招待講演 1件) 図書 (1件) 備考 (2件)

  • [雑誌論文] Quantifying the Activities of Local Assembly Members in Japan: Recent Advances and an Approach Using the BERTopic Model2024

    • 著者名/発表者名
      LI Xinhe、KAWAMURA Kazunori、KIMURA Yasutomo
    • 雑誌名

      Interdisciplinary Information Sciences

      巻: 30 号: 1 ページ: 68-101

    • DOI

      10.4036/iis.2024.R.03

    • ISSN
      1340-9050, 1347-6157
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] BERTベース分類器とSHAPを用いた地方議会議員の議会発言における特徴分析2023

    • 著者名/発表者名
      乙武北斗, 高丸圭一, 内田ゆず, 木村泰知
    • 雑誌名

      知能と情報

      巻: 35 号: 3 ページ: 700-705

    • DOI

      10.3156/jsoft.35.3_700

    • ISSN
      1347-7986, 1881-7203
    • 年月日
      2023-08-15
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 非構造化データを活用する試み ―議会会議録と有価証券報告書を例として―2023

    • 著者名/発表者名
      木村泰知
    • 雑誌名

      計画行政

      巻: 46

    • 関連する報告書
      2023 実績報告書
  • [雑誌論文] Deeds, Not Words? Speech and Re-Election of Japan’s Local Legislators2023

    • 著者名/発表者名
      Akihiko Kawaura, Yasutomo Kimura and Yuzu Uchida
    • 雑誌名

      Constitutional Political Economy

      巻: - 号: 1 ページ: 123-140

    • DOI

      10.1007/s10602-023-09402-3

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] 妊娠・出産;育児に関する情報サイトにおける自治体による子育て支援効果の調査2024

    • 著者名/発表者名
      新井田瑠璃, 佐藤栄作, 木村泰知, 内田ゆず
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 有価証券報告書に含まれるデータの企業間比較における課題について2024

    • 著者名/発表者名
      佐藤栄作, 木村泰知
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 妊娠・出産・育児に関する情報サイトを対象とした母親が求めている回答の特徴分析2024

    • 著者名/発表者名
      黒沢匠, 木村泰知, 内田ゆず
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 有価証券報告書を対象とした機械判読が困難な表構造の分析2024

    • 著者名/発表者名
      奥山和樹, 木村泰知
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] OUC at NTCIR-17 UFO TDE and TTRE2023

    • 著者名/発表者名
      Eisaku Sato, Keiyu Nagafuchi, Yuma Kasahara, Kazuma Kadowaki, Yasutomo Kimura
    • 学会等名
      Proceedings of The 17th NTCIR Conference}
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Overview of the NTCIR-17 QA Lab-PoliInfo-4 Task2023

    • 著者名/発表者名
      Yasuhiro Ogawa, Yasutomo Kimura, Hideyuki Shibuki, Hokuto Ototake, Yuzu Uchida, Keiichi Takamaru, Kazuma Kadowaki, Tomoyoshi Akiba, Minoru Sasaki, Akio Kobayashi, Masaharu Yoshioka, Tatsunori Mori, Kenji Araki, Teruko Mitamura
    • 学会等名
      Proceedings of The 17th NTCIR Conference
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Overview of the NTCIR-17 UFO Task2023

    • 著者名/発表者名
      Yasutomo Kimura, Hokuto Ototake, Kazuma Kadowaki, Takahito Kondo, Makoto P. Kato
    • 学会等名
      Proceedings of The 17th NTCIR Conference
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 複数エージェントによる 文脈生成AIを用いた 情報共有システムの提案2023

    • 著者名/発表者名
      笠原有真, 木村泰知, 小野哲雄
    • 学会等名
      第22回情報科学技術フォーラム(FIT2023)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 国会および地方議会会議録をコーパスとした事前学習済み言語モデルの構築と検証2023

    • 著者名/発表者名
      永渕景祐, 佐藤栄作, 木村泰知, 門脇一真, 荒木健治
    • 学会等名
      第20回テキストアナリティクス・シンポジウム
    • 関連する報告書
      2023 実績報告書
  • [学会発表] researchmapの情報を用いた異なる研究分野間の研究者マッチングの試み2023

    • 著者名/発表者名
      前多 陸玖, 廣吉 和貴, 木村 泰知
    • 学会等名
      第22回情報科学技術フォーラム(FIT2023)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] TOPIX100の有価証券報告書の表を対象としたChatGPTによるPDFからJSONへの自動変換の試み2023

    • 著者名/発表者名
      佐藤 栄作, 木村 泰知
    • 学会等名
      第22回情報科学技術フォーラム(FIT2023)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] NTCIR-16 QA Lab-PoliInfo-3 Fact Verificationの報告およびデータセット公開2023

    • 著者名/発表者名
      横手 健一, 渋木 英潔, 秋葉 友良, 木村 泰知
    • 学会等名
      人工知能学会全国大会(第37回)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 階層的な分類構造を活用したSHAPによる地方議会会議録における特徴表現抽出の試み2023

    • 著者名/発表者名
      乙武 北斗, 高丸 圭一, 内田 ゆず, 木村 泰知
    • 学会等名
      人工知能学会全国大会論文集
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 議会会議録と予算表を紐づけるMinutes-to-Budget Linkingタスクの提案2023

    • 著者名/発表者名
      木村泰知, 梶縁, 乙武北斗, 門脇一真, 佐々木稔, 小林暁雄
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] NTCIR-17 QA Lab-PoliInfo-4 Answer VerificationにおけるGDADCの利用に向けての考察2023

    • 著者名/発表者名
      渋木英潔, BESNA, 内田ゆず, 小川泰弘, 門脇一真, 木村泰知
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 地方議会における議案への賛否に関する発言の分析 ―NTCIR-17 QA Lab-PoliInfo4 Stance Classification-2タスクに向けて―2023

    • 著者名/発表者名
      高丸圭一, 内田ゆず, 木村泰知, 秋葉友良
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 地方議会議事録を対象としたスタンス分類データセットの自動構築とベースライン分類器の評価2023

    • 著者名/発表者名
      我藤勇樹, 秋葉友良, 内田ゆず, 木村泰知, 高丸圭一
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] NTCIR-17 QA Lab-PoliInfo-4 のタスク設計2023

    • 著者名/発表者名
      小川泰弘, 木村泰知, 渋木英潔, SNA, 乙武北斗, 内田ゆず, 高丸圭一, 門脇一真, 秋葉友良, 佐々木稔, 小林暁雄
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Budget Argument Mining Dataset Using Japanese Minutes from the National Diet and Local Assemblies2022

    • 著者名/発表者名
      Yasutomo Kimura, Hokuto Ototake, Minoru Sasaki
    • 学会等名
      LREC 2022
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 地方自治体の予算を対象にした金額表現の分析2022

    • 著者名/発表者名
      梶 縁, 木村 泰知
    • 学会等名
      第38回ファジィシステムシンポジウム(FSS2022)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 国会会議録を用いた事前学習済みELECTRAの構築と政治ドメインのタスクによる検証2022

    • 著者名/発表者名
      永渕 景祐, 木村 泰知, 荒木 健治
    • 学会等名
      情報処理学会 第21回情報科学技術フォーラム(FIT2022)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] BERTベース分類器とSHAPによる地方議会会議録における特徴表現抽出の試み2022

    • 著者名/発表者名
      乙武 北斗, 高丸 圭一, 内田 ゆず, 木村 泰知
    • 学会等名
      人工知能学会全国大会論文集 第36回全国大会 (2022)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] OUC at the NTCIR-16 QA Lab-PoliInfo-3 Budget Argument Mining2022

    • 著者名/発表者名
      Keiyu Nagafuchi, Rin Sasaki, Seiya Oki, Yasutomo Kimura, Kenji Araki
    • 学会等名
      The 16th NTCIR Conference Evaluation of Information Access Technologies
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Overview of the NTCIR-16 QA Lab-PoliInfo-3 Task2022

    • 著者名/発表者名
      Yasutomo Kimura, Hideyuki Shibuki, Hokuto Ototake, Yuzu Uchida, Keiichi Takamaru, Madoka Ishioroshi, Kazuma Kadowaki, Masaharu Yoshioka, Tomoyosi Akiba, Yasuhiro Ogawa, Minoru Sasaki, Ken-Ichi Yokote, Tatsunori Mori, Kenji Araki, Teruko Mitamura, Satoshi Sekine
    • 学会等名
      The 16th NTCIR Conference Evaluation of Information Access Technologies
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 予算項目に関連する議論を対応づけるBudget Argument Mining のデータセット構築2021

    • 著者名/発表者名
      木村泰知・ 永渕 景祐・乙武 北斗・佐々木 稔
    • 学会等名
      自然言語処理研究会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Shared Tasks on Japanese Local Assembly Minutes Dataset2021

    • 著者名/発表者名
      Yasutomo Kimura
    • 学会等名
      Fifteenth International Workshop on Juris-informatics
    • 関連する報告書
      2021 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] 構造化データ作成を目的としたPDF地方議会資料のテキスト抽出に関する分析2021

    • 著者名/発表者名
      乙武 北斗, 内田 ゆず, 高丸 圭一, 木村 泰知
    • 学会等名
      第37回ファジィシステムシンポジウム講演論文集
    • 関連する報告書
      2021 実績報告書
  • [図書] 自治体DX推進とオープンデータの活用2022

    • 著者名/発表者名
      木村泰知、高丸圭一、内田ゆず、本田 正美、河村 和徳、乙武 北斗、吐合 大祐、遠藤 勇哉
    • 総ページ数
      288
    • 出版者
      日本経済評論社
    • ISBN
      4818826057
    • 関連する報告書
      2021 実績報告書
  • [備考] 都道府県議会会議録検索システム「ぎーみる」

    • URL

      http://local-politics.jp/

    • 関連する報告書
      2021 実績報告書
  • [備考] QA Lab PoliInfo-3

    • URL

      https://poliinfo3.net/

    • 関連する報告書
      2021 実績報告書

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi