• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実施状況報告書

国会会議録コーパスと地方議会会議録コーパスを横断した言語的分析

研究課題

研究課題/領域番号 20K00576
研究機関宇都宮共和大学

研究代表者

高丸 圭一  宇都宮共和大学, シティライフ学部, 教授 (60383121)

研究分担者 松田 謙次郎  神戸松蔭女子学院大学, 文学部, 教授 (40263636)
内田 ゆず  北海学園大学, 工学部, 教授 (80583575)
木村 泰知  小樽商科大学, 商学部, 教授 (50400073)
乙武 北斗  福岡大学, 工学部, 助教 (20580179)
研究期間 (年度) 2020-04-01 – 2025-03-31
キーワード地方議会会議録 / 国会会議録 / コーパス / XAI
研究実績の概要

地方議会会議録と国会会議録を対象としたXAIによる特徴表現の可視化を試みた。まず,BERTを用い,入力文が地方議会会議録であるか国会会議録を分類する2値分類器を構築した。次に,Integrated Gradientsに代表される推論結果を説明する手法を用い,入力文における各トークンの分類貢献度を算出し,どの部分を手がかりに分類器が推定を行ったかを可視化した。可視化結果を分析し,推定の手がかりとなった部分にどのような表現が存在するかを考察した。
この結果、国会会議録の正例では国会らしい語彙や国政特有のフレーズが,地方議会会議録の正例では地方議会らしい語彙や地方行政特有のフレーズがそれぞれポジティブの貢献をするトークンとして可視化されていることが確認された。国会会議録と地方議会会議録の差異として,漢字の送り仮名(「取組」,「取り組み」),数字の表記(漢数字,アラビア数字),入力文の区切り方(入力文中の句点)などが観察された。他方で,可視化結果には解釈が難しいと考えられるケースが多様に存在することも明らかになった。
XAIによる可視化が特徴分析の手助けとなると考えられるものの,可視化結果と人間が特徴的であると捉える文字列は十分に一致しない。種々のXAIの手法を子細に比較したり,XAIの出力を後処理することで可視化手法を高度化することで,機械学習の専門家以外にも利用しやすいコーパス間の特徴分析手法の検討を進めていく必要があると考えられる。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

コロナ禍の影響で学会および研究打ち合わせにおける議論が十分に行えない期間が続いたため,研究期間を通して研究進捗はやや遅れ気味であった。2022年度にはAIを活用した研究手法を導入したことで,研究をやや加速することができ,順調な進展となった。2023年度は研究成果にとりまとめおよび学会発表・学術論文の投稿を行うことができた。研究期間を延長し,2024年度には国際会議において研究成果の公開を行う。

今後の研究の推進方策

研究グループにおけるディスカッションおよび学会発表・論文投稿を通して,より効果的な特徴抽出手法を検討し,国会会議録と地方議会会議録の言語的特徴の分析結果をとりまとめていく予定である。

次年度使用額が生じた理由

実施予定(参加予定)であった共同研究者間の打ち合わせや学会発表等の対面でのディスカッションの次期が後ろ倒しになったため繰越が生じた。これらは2024年度に時期をずらして実施する予定である

  • 研究成果

    (7件)

すべて 2024 2023 その他

すべて 雑誌論文 (4件) (うち査読あり 2件、 オープンアクセス 3件) 学会発表 (1件) 備考 (2件)

  • [雑誌論文] 説明可能なAI技術を用いた国会会議録と地方議会会議録の特徴比較2024

    • 著者名/発表者名
      高丸圭一, 乙武北斗, 内田ゆず, 木村泰知
    • 雑誌名

      宇都宮共和大学シティライフ学研究

      巻: 25 ページ: 75-87

    • オープンアクセス
  • [雑誌論文] 地方議会会議録における探索的方言調査の試み―機械学習とXAI 技術による方言研究―2023

    • 著者名/発表者名
      高丸圭一,乙武北斗
    • 雑誌名

      方言の研究

      巻: 9 ページ: 27-51

    • 査読あり
  • [雑誌論文] BERTベース分類器とSHAPを用いた地方議会議員の議会発言における特徴分析2023

    • 著者名/発表者名
      乙武北斗, 高丸圭一, 内田ゆず, 木村泰知
    • 雑誌名

      知能と情報

      巻: 35(3) ページ: 700-705

    • DOI

      10.3156/jsoft.35.3_700

    • 査読あり / オープンアクセス
  • [雑誌論文] XAI技術を用いた大規模言語資源の特徴可視化の試み ―地方議会会議録横断検索「ぎ~みる」を例に―2023

    • 著者名/発表者名
      乙武北斗, 高丸圭一
    • 雑誌名

      計量国語学

      巻: 34(3) ページ: 174-187

    • オープンアクセス
  • [学会発表] 階層的な分類構造を活用したSHAPによる地方議会会議録における特徴表現抽出の試み2023

    • 著者名/発表者名
      乙武北斗, 高丸圭一, 内田ゆず, 木村泰知
    • 学会等名
      第37回人工知能学会全国大会
  • [備考] 地方議会会議録コーパスプロジェクト

    • URL

      http://local-politics.jp/

  • [備考] 高丸研究室

    • URL

      http://www.takamaruzemi.com/

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi