• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

国会会議録コーパスと地方議会会議録コーパスを横断した言語的分析

Research Project

Project/Area Number 20K00576
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 02060:Linguistics-related
Research InstitutionUtsunomiya Kyowa University

Principal Investigator

高丸 圭一  宇都宮共和大学, シティライフ学部, 教授 (60383121)

Co-Investigator(Kenkyū-buntansha) 松田 謙次郎  神戸松蔭女子学院大学, 文学部, 教授 (40263636)
内田 ゆず  北海学園大学, 工学部, 教授 (80583575)
木村 泰知  小樽商科大学, 商学部, 教授 (50400073)
乙武 北斗  福岡大学, 工学部, 助教 (20580179)
Project Period (FY) 2020-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2022: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2020: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Keywords地方議会会議録 / 国会会議録 / コーパス / XAI
Outline of Research at the Start

本研究では、地方議会会議録および国会会議録を横断的に取り扱い、発言者および発言者の属性に着目して「発話スタイルの変化」「方言語彙やオノマトペなどの使用」「政治関連語彙の使用」についての分析を行う。本研究で行う研究項目は以下のとおりである。
① 同一人物の発言に着目し、言語的特徴を分析する。
② 発言者の属性に基づいて、言語的特徴を分析する。
③ 談話分析への展開を視野に入れ、議論の構造の分析を行う。

Outline of Annual Research Achievements

地方議会会議録と国会会議録を対象としたXAIによる特徴表現の可視化を試みた。まず,BERTを用い,入力文が地方議会会議録であるか国会会議録を分類する2値分類器を構築した。次に,Integrated Gradientsに代表される推論結果を説明する手法を用い,入力文における各トークンの分類貢献度を算出し,どの部分を手がかりに分類器が推定を行ったかを可視化した。可視化結果を分析し,推定の手がかりとなった部分にどのような表現が存在するかを考察した。
この結果、国会会議録の正例では国会らしい語彙や国政特有のフレーズが,地方議会会議録の正例では地方議会らしい語彙や地方行政特有のフレーズがそれぞれポジティブの貢献をするトークンとして可視化されていることが確認された。国会会議録と地方議会会議録の差異として,漢字の送り仮名(「取組」,「取り組み」),数字の表記(漢数字,アラビア数字),入力文の区切り方(入力文中の句点)などが観察された。他方で,可視化結果には解釈が難しいと考えられるケースが多様に存在することも明らかになった。
XAIによる可視化が特徴分析の手助けとなると考えられるものの,可視化結果と人間が特徴的であると捉える文字列は十分に一致しない。種々のXAIの手法を子細に比較したり,XAIの出力を後処理することで可視化手法を高度化することで,機械学習の専門家以外にも利用しやすいコーパス間の特徴分析手法の検討を進めていく必要があると考えられる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

コロナ禍の影響で学会および研究打ち合わせにおける議論が十分に行えない期間が続いたため,研究期間を通して研究進捗はやや遅れ気味であった。2022年度にはAIを活用した研究手法を導入したことで,研究をやや加速することができ,順調な進展となった。2023年度は研究成果にとりまとめおよび学会発表・学術論文の投稿を行うことができた。研究期間を延長し,2024年度には国際会議において研究成果の公開を行う。

Strategy for Future Research Activity

研究グループにおけるディスカッションおよび学会発表・論文投稿を通して,より効果的な特徴抽出手法を検討し,国会会議録と地方議会会議録の言語的特徴の分析結果をとりまとめていく予定である。

Report

(4 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (19 results)

All 2024 2023 2022 2021 2020 Other

All Journal Article (5 results) (of which Peer Reviewed: 3 results,  Open Access: 3 results) Presentation (11 results) Book (1 results) Remarks (2 results)

  • [Journal Article] 説明可能なAI技術を用いた国会会議録と地方議会会議録の特徴比較2024

    • Author(s)
      高丸圭一, 乙武北斗, 内田ゆず, 木村泰知
    • Journal Title

      宇都宮共和大学シティライフ学研究

      Volume: 25 Pages: 75-87

    • Related Report
      2023 Research-status Report
    • Open Access
  • [Journal Article] Feature Analysis of Utterances in Local Assembly Minutes Using SHAP with BERT-Based Classifier2023

    • Author(s)
      乙武北斗, 高丸圭一, 内田ゆず, 木村泰知
    • Journal Title

      Journal of Japan Society for Fuzzy Theory and Intelligent Informatics

      Volume: 35 Issue: 3 Pages: 700-705

    • DOI

      10.3156/jsoft.35.3_700

    • ISSN
      1347-7986, 1881-7203
    • Year and Date
      2023-08-15
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] 地方議会会議録における探索的方言調査の試み―機械学習とXAI 技術による方言研究―2023

    • Author(s)
      高丸圭一,乙武北斗
    • Journal Title

      方言の研究

      Volume: 9 Pages: 27-51

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] XAI技術を用いた大規模言語資源の特徴可視化の試み ―地方議会会議録横断検索「ぎ~みる」を例に―2023

    • Author(s)
      乙武北斗, 高丸圭一
    • Journal Title

      計量国語学

      Volume: 34(3) Pages: 174-187

    • Related Report
      2023 Research-status Report
    • Open Access
  • [Journal Article] Extraction of the Argument Structure of Tokyo Metropolitan Assembly Minutes: Segmentation of Question-and-Answer Sets2020

    • Author(s)
      Keiichi Takamaru, Yasutomo Kimura, Hideyuki Shibuki, Hokuto Ototake, Yuzu Uchida, Kotaro Sakamoto, Madoka Ishioroshi, Teruko Mitamura, Noriko Kando
    • Journal Title

      Proceedings of The 12th Language Resources and Evaluation Conference

      Volume: - Pages: 2064-2068

    • Related Report
      2020 Research-status Report
    • Peer Reviewed
  • [Presentation] 階層的な分類構造を活用したSHAPによる地方議会会議録における特徴表現抽出の試み2023

    • Author(s)
      乙武北斗, 高丸圭一, 内田ゆず, 木村泰知
    • Organizer
      第37回人工知能学会全国大会
    • Related Report
      2023 Research-status Report
  • [Presentation] NTCIR-17 QA Lab-PoliInfo-4 のタスク設計2023

    • Author(s)
      小川泰弘, 木村泰知, 渋木英潔, 乙武北斗, 内田ゆず, 高丸圭一, 門脇一真, 秋葉友良, 佐々木稔, 小林暁雄
    • Organizer
      言語処理学会第29回年次大会(NLP2023)
    • Related Report
      2022 Research-status Report
  • [Presentation] 地方議会議事録を対象としたスタンス分類データセットの自動構築とベースライン分類器の評価2023

    • Author(s)
      我藤勇樹, 秋葉友良, 内田ゆず, 木村泰知, 高丸圭一
    • Organizer
      言語処理学会第29回年次大会(NLP2023)
    • Related Report
      2022 Research-status Report
  • [Presentation] 地方議会における議案への賛否に関する発言の分析 ―NTCIR-17 QA Lab-PoliInfo4 Stance Classification-2タスクに向けて―2023

    • Author(s)
      高丸圭一, 内田ゆず, 木村泰知, 秋葉友良
    • Organizer
      言語処理学会第29回年次大会(NLP2023)
    • Related Report
      2022 Research-status Report
  • [Presentation] 妊娠・出産・育児に関する情報サイトにおける母親の検索行動の予備的分析2023

    • Author(s)
      内田ゆず, 高丸圭一, 乙武北斗, 木村泰知
    • Organizer
      言語処理学会第29回年次大会(NLP2023)
    • Related Report
      2022 Research-status Report
  • [Presentation] BERTベース分類器とSHAPによる地方議会会議録における特徴表現抽出の試み2022

    • Author(s)
      乙武北斗, 高丸圭一, 内田ゆず, 木村泰知
    • Organizer
      2022年度人工知能学会全国大会(第36回)
    • Related Report
      2022 Research-status Report
  • [Presentation] 構造化データ作成を目的としたPDF地方議会資料のテキスト抽出に関する分析2021

    • Author(s)
      乙武 北斗, 内田 ゆず, 高丸 圭一, 木村 泰知
    • Organizer
      第37回ファジィシステムシンポジウム講演論文集
    • Related Report
      2021 Research-status Report
  • [Presentation] 都道府県議会会議録コーパスの拡張―2011期と2015期の比較―2021

    • Author(s)
      内田ゆず, 高丸圭一, 乙武北斗, 木村泰知
    • Organizer
      言語処理学会第27回年次大会
    • Related Report
      2020 Research-status Report
  • [Presentation] NTCIR15 QA Lab-PoliInfo-2の報告およびデータセット公開2021

    • Author(s)
      木村泰知, 渋木英潔, 高丸圭一, 内田ゆず, 乙武北斗, 石下円香, 三田村照子, 吉岡真治, 秋葉友良, 小川泰弘, 佐々木稔, 横手健一, 神門典子, 森辰則, 荒木健治, 関根聡
    • Organizer
      言語処理学会第27回年次大会
    • Related Report
      2020 Research-status Report
  • [Presentation] テキストデータの公開による実現可能な応用技術に向けたタスク設計2020

    • Author(s)
      高丸圭一
    • Organizer
      2020年度社会情報学会(SSI)学会大会, Workshop2「民主制下における地方自治体の情報公開・オープンデータと情報セキュリティとの交錯に関する研究」
    • Related Report
      2020 Research-status Report
  • [Presentation] 東京都議会会議録における議案への賛否を表明する発言の分析2020

    • Author(s)
      高丸 圭一, 木村 泰知, 内田 ゆず, 佐々木 稔, 吉岡 真治, 秋葉 友良, 渋木 英潔
    • Organizer
      第34回人工知能学会全国大会
    • Related Report
      2020 Research-status Report
  • [Book] 自治体DX推進とオープンデータの活用2022

    • Author(s)
      木村泰知、高丸圭一、内田ゆず、本田 正美、河村 和徳、乙武 北斗、吐合 大祐、遠藤 勇哉
    • Total Pages
      288
    • Publisher
      日本経済評論社
    • ISBN
      9784818826052
    • Related Report
      2021 Research-status Report
  • [Remarks] 地方議会会議録コーパスプロジェクト

    • URL

      http://local-politics.jp/

    • Related Report
      2023 Research-status Report 2022 Research-status Report 2021 Research-status Report 2020 Research-status Report
  • [Remarks] 高丸研究室

    • URL

      http://www.takamaruzemi.com/

    • Related Report
      2023 Research-status Report 2022 Research-status Report 2021 Research-status Report 2020 Research-status Report

URL: 

Published: 2020-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi