研究課題/領域番号 |
20K00576
|
研究機関 | 宇都宮共和大学 |
研究代表者 |
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
|
研究分担者 |
松田 謙次郎 神戸松蔭女子学院大学, 文学部, 教授 (40263636)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
キーワード | 地方議会会議録 / 国会会議録 / コーパス / XAI |
研究実績の概要 |
地方議会会議録と国会会議録を対象としたXAIによる特徴表現の可視化を試みた。まず,BERTを用い,入力文が地方議会会議録であるか国会会議録を分類する2値分類器を構築した。次に,Integrated Gradientsに代表される推論結果を説明する手法を用い,入力文における各トークンの分類貢献度を算出し,どの部分を手がかりに分類器が推定を行ったかを可視化した。可視化結果を分析し,推定の手がかりとなった部分にどのような表現が存在するかを考察した。 この結果、国会会議録の正例では国会らしい語彙や国政特有のフレーズが,地方議会会議録の正例では地方議会らしい語彙や地方行政特有のフレーズがそれぞれポジティブの貢献をするトークンとして可視化されていることが確認された。国会会議録と地方議会会議録の差異として,漢字の送り仮名(「取組」,「取り組み」),数字の表記(漢数字,アラビア数字),入力文の区切り方(入力文中の句点)などが観察された。他方で,可視化結果には解釈が難しいと考えられるケースが多様に存在することも明らかになった。 XAIによる可視化が特徴分析の手助けとなると考えられるものの,可視化結果と人間が特徴的であると捉える文字列は十分に一致しない。種々のXAIの手法を子細に比較したり,XAIの出力を後処理することで可視化手法を高度化することで,機械学習の専門家以外にも利用しやすいコーパス間の特徴分析手法の検討を進めていく必要があると考えられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
コロナ禍の影響で学会および研究打ち合わせにおける議論が十分に行えない期間が続いたため,研究期間を通して研究進捗はやや遅れ気味であった。2022年度にはAIを活用した研究手法を導入したことで,研究をやや加速することができ,順調な進展となった。2023年度は研究成果にとりまとめおよび学会発表・学術論文の投稿を行うことができた。研究期間を延長し,2024年度には国際会議において研究成果の公開を行う。
|
今後の研究の推進方策 |
研究グループにおけるディスカッションおよび学会発表・論文投稿を通して,より効果的な特徴抽出手法を検討し,国会会議録と地方議会会議録の言語的特徴の分析結果をとりまとめていく予定である。
|
次年度使用額が生じた理由 |
実施予定(参加予定)であった共同研究者間の打ち合わせや学会発表等の対面でのディスカッションの次期が後ろ倒しになったため繰越が生じた。これらは2024年度に時期をずらして実施する予定である
|