• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

国会会議録コーパスと地方議会会議録コーパスを横断した言語的分析

研究課題

研究課題/領域番号 20K00576
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分02060:言語学関連
研究機関宇都宮共和大学

研究代表者

高丸 圭一  宇都宮共和大学, シティライフ学部, 教授 (60383121)

研究分担者 松田 謙次郎  神戸松蔭女子学院大学, 文学部, 教授 (40263636)
内田 ゆず  北海学園大学, 工学部, 教授 (80583575)
木村 泰知  小樽商科大学, 商学部, 教授 (50400073)
乙武 北斗  福岡大学, 工学部, 助教 (20580179)
研究期間 (年度) 2020-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード地方議会会議録 / 国会会議録 / コーパス / XAI
研究開始時の研究の概要

本研究では、地方議会会議録および国会会議録を横断的に取り扱い、発言者および発言者の属性に着目して「発話スタイルの変化」「方言語彙やオノマトペなどの使用」「政治関連語彙の使用」についての分析を行う。本研究で行う研究項目は以下のとおりである。
① 同一人物の発言に着目し、言語的特徴を分析する。
② 発言者の属性に基づいて、言語的特徴を分析する。
③ 談話分析への展開を視野に入れ、議論の構造の分析を行う。

研究実績の概要

地方議会会議録と国会会議録を対象としたXAIによる特徴表現の可視化を試みた。まず,BERTを用い,入力文が地方議会会議録であるか国会会議録を分類する2値分類器を構築した。次に,Integrated Gradientsに代表される推論結果を説明する手法を用い,入力文における各トークンの分類貢献度を算出し,どの部分を手がかりに分類器が推定を行ったかを可視化した。可視化結果を分析し,推定の手がかりとなった部分にどのような表現が存在するかを考察した。
この結果、国会会議録の正例では国会らしい語彙や国政特有のフレーズが,地方議会会議録の正例では地方議会らしい語彙や地方行政特有のフレーズがそれぞれポジティブの貢献をするトークンとして可視化されていることが確認された。国会会議録と地方議会会議録の差異として,漢字の送り仮名(「取組」,「取り組み」),数字の表記(漢数字,アラビア数字),入力文の区切り方(入力文中の句点)などが観察された。他方で,可視化結果には解釈が難しいと考えられるケースが多様に存在することも明らかになった。
XAIによる可視化が特徴分析の手助けとなると考えられるものの,可視化結果と人間が特徴的であると捉える文字列は十分に一致しない。種々のXAIの手法を子細に比較したり,XAIの出力を後処理することで可視化手法を高度化することで,機械学習の専門家以外にも利用しやすいコーパス間の特徴分析手法の検討を進めていく必要があると考えられる。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

コロナ禍の影響で学会および研究打ち合わせにおける議論が十分に行えない期間が続いたため,研究期間を通して研究進捗はやや遅れ気味であった。2022年度にはAIを活用した研究手法を導入したことで,研究をやや加速することができ,順調な進展となった。2023年度は研究成果にとりまとめおよび学会発表・学術論文の投稿を行うことができた。研究期間を延長し,2024年度には国際会議において研究成果の公開を行う。

今後の研究の推進方策

研究グループにおけるディスカッションおよび学会発表・論文投稿を通して,より効果的な特徴抽出手法を検討し,国会会議録と地方議会会議録の言語的特徴の分析結果をとりまとめていく予定である。

報告書

(4件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 研究成果

    (19件)

すべて 2024 2023 2022 2021 2020 その他

すべて 雑誌論文 (5件) (うち査読あり 3件、 オープンアクセス 3件) 学会発表 (11件) 図書 (1件) 備考 (2件)

  • [雑誌論文] 説明可能なAI技術を用いた国会会議録と地方議会会議録の特徴比較2024

    • 著者名/発表者名
      高丸圭一, 乙武北斗, 内田ゆず, 木村泰知
    • 雑誌名

      宇都宮共和大学シティライフ学研究

      巻: 25 ページ: 75-87

    • 関連する報告書
      2023 実施状況報告書
    • オープンアクセス
  • [雑誌論文] BERTベース分類器とSHAPを用いた地方議会議員の議会発言における特徴分析2023

    • 著者名/発表者名
      乙武北斗, 高丸圭一, 内田ゆず, 木村泰知
    • 雑誌名

      知能と情報

      巻: 35 号: 3 ページ: 700-705

    • DOI

      10.3156/jsoft.35.3_700

    • ISSN
      1347-7986, 1881-7203
    • 年月日
      2023-08-15
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 地方議会会議録における探索的方言調査の試み―機械学習とXAI 技術による方言研究―2023

    • 著者名/発表者名
      高丸圭一,乙武北斗
    • 雑誌名

      方言の研究

      巻: 9 ページ: 27-51

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] XAI技術を用いた大規模言語資源の特徴可視化の試み ―地方議会会議録横断検索「ぎ~みる」を例に―2023

    • 著者名/発表者名
      乙武北斗, 高丸圭一
    • 雑誌名

      計量国語学

      巻: 34(3) ページ: 174-187

    • 関連する報告書
      2023 実施状況報告書
    • オープンアクセス
  • [雑誌論文] Extraction of the Argument Structure of Tokyo Metropolitan Assembly Minutes: Segmentation of Question-and-Answer Sets2020

    • 著者名/発表者名
      Keiichi Takamaru, Yasutomo Kimura, Hideyuki Shibuki, Hokuto Ototake, Yuzu Uchida, Kotaro Sakamoto, Madoka Ishioroshi, Teruko Mitamura, Noriko Kando
    • 雑誌名

      Proceedings of The 12th Language Resources and Evaluation Conference

      巻: - ページ: 2064-2068

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり
  • [学会発表] 階層的な分類構造を活用したSHAPによる地方議会会議録における特徴表現抽出の試み2023

    • 著者名/発表者名
      乙武北斗, 高丸圭一, 内田ゆず, 木村泰知
    • 学会等名
      第37回人工知能学会全国大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] NTCIR-17 QA Lab-PoliInfo-4 のタスク設計2023

    • 著者名/発表者名
      小川泰弘, 木村泰知, 渋木英潔, 乙武北斗, 内田ゆず, 高丸圭一, 門脇一真, 秋葉友良, 佐々木稔, 小林暁雄
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 地方議会議事録を対象としたスタンス分類データセットの自動構築とベースライン分類器の評価2023

    • 著者名/発表者名
      我藤勇樹, 秋葉友良, 内田ゆず, 木村泰知, 高丸圭一
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 地方議会における議案への賛否に関する発言の分析 ―NTCIR-17 QA Lab-PoliInfo4 Stance Classification-2タスクに向けて―2023

    • 著者名/発表者名
      高丸圭一, 内田ゆず, 木村泰知, 秋葉友良
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 妊娠・出産・育児に関する情報サイトにおける母親の検索行動の予備的分析2023

    • 著者名/発表者名
      内田ゆず, 高丸圭一, 乙武北斗, 木村泰知
    • 学会等名
      言語処理学会第29回年次大会(NLP2023)
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] BERTベース分類器とSHAPによる地方議会会議録における特徴表現抽出の試み2022

    • 著者名/発表者名
      乙武北斗, 高丸圭一, 内田ゆず, 木村泰知
    • 学会等名
      2022年度人工知能学会全国大会(第36回)
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 構造化データ作成を目的としたPDF地方議会資料のテキスト抽出に関する分析2021

    • 著者名/発表者名
      乙武 北斗, 内田 ゆず, 高丸 圭一, 木村 泰知
    • 学会等名
      第37回ファジィシステムシンポジウム講演論文集
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 都道府県議会会議録コーパスの拡張―2011期と2015期の比較―2021

    • 著者名/発表者名
      内田ゆず, 高丸圭一, 乙武北斗, 木村泰知
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] NTCIR15 QA Lab-PoliInfo-2の報告およびデータセット公開2021

    • 著者名/発表者名
      木村泰知, 渋木英潔, 高丸圭一, 内田ゆず, 乙武北斗, 石下円香, 三田村照子, 吉岡真治, 秋葉友良, 小川泰弘, 佐々木稔, 横手健一, 神門典子, 森辰則, 荒木健治, 関根聡
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] テキストデータの公開による実現可能な応用技術に向けたタスク設計2020

    • 著者名/発表者名
      高丸圭一
    • 学会等名
      2020年度社会情報学会(SSI)学会大会, Workshop2「民主制下における地方自治体の情報公開・オープンデータと情報セキュリティとの交錯に関する研究」
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 東京都議会会議録における議案への賛否を表明する発言の分析2020

    • 著者名/発表者名
      高丸 圭一, 木村 泰知, 内田 ゆず, 佐々木 稔, 吉岡 真治, 秋葉 友良, 渋木 英潔
    • 学会等名
      第34回人工知能学会全国大会
    • 関連する報告書
      2020 実施状況報告書
  • [図書] 自治体DX推進とオープンデータの活用2022

    • 著者名/発表者名
      木村泰知、高丸圭一、内田ゆず、本田 正美、河村 和徳、乙武 北斗、吐合 大祐、遠藤 勇哉
    • 総ページ数
      288
    • 出版者
      日本経済評論社
    • ISBN
      9784818826052
    • 関連する報告書
      2021 実施状況報告書
  • [備考] 地方議会会議録コーパスプロジェクト

    • URL

      http://local-politics.jp/

    • 関連する報告書
      2023 実施状況報告書 2022 実施状況報告書 2021 実施状況報告書 2020 実施状況報告書
  • [備考] 高丸研究室

    • URL

      http://www.takamaruzemi.com/

    • 関連する報告書
      2023 実施状況報告書 2022 実施状況報告書 2021 実施状況報告書 2020 実施状況報告書

URL: 

公開日: 2020-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi