研究課題/領域番号 |
20K00576
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 宇都宮共和大学 |
研究代表者 |
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
|
研究分担者 |
松田 謙次郎 神戸松蔭女子学院大学, 文学部, 教授 (40263636)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 地方議会会議録 / 国会会議録 / コーパス / XAI |
研究開始時の研究の概要 |
本研究では、地方議会会議録および国会会議録を横断的に取り扱い、発言者および発言者の属性に着目して「発話スタイルの変化」「方言語彙やオノマトペなどの使用」「政治関連語彙の使用」についての分析を行う。本研究で行う研究項目は以下のとおりである。 ① 同一人物の発言に着目し、言語的特徴を分析する。 ② 発言者の属性に基づいて、言語的特徴を分析する。 ③ 談話分析への展開を視野に入れ、議論の構造の分析を行う。
|
研究実績の概要 |
地方議会会議録と国会会議録を対象としたXAIによる特徴表現の可視化を試みた。まず,BERTを用い,入力文が地方議会会議録であるか国会会議録を分類する2値分類器を構築した。次に,Integrated Gradientsに代表される推論結果を説明する手法を用い,入力文における各トークンの分類貢献度を算出し,どの部分を手がかりに分類器が推定を行ったかを可視化した。可視化結果を分析し,推定の手がかりとなった部分にどのような表現が存在するかを考察した。 この結果、国会会議録の正例では国会らしい語彙や国政特有のフレーズが,地方議会会議録の正例では地方議会らしい語彙や地方行政特有のフレーズがそれぞれポジティブの貢献をするトークンとして可視化されていることが確認された。国会会議録と地方議会会議録の差異として,漢字の送り仮名(「取組」,「取り組み」),数字の表記(漢数字,アラビア数字),入力文の区切り方(入力文中の句点)などが観察された。他方で,可視化結果には解釈が難しいと考えられるケースが多様に存在することも明らかになった。 XAIによる可視化が特徴分析の手助けとなると考えられるものの,可視化結果と人間が特徴的であると捉える文字列は十分に一致しない。種々のXAIの手法を子細に比較したり,XAIの出力を後処理することで可視化手法を高度化することで,機械学習の専門家以外にも利用しやすいコーパス間の特徴分析手法の検討を進めていく必要があると考えられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
コロナ禍の影響で学会および研究打ち合わせにおける議論が十分に行えない期間が続いたため,研究期間を通して研究進捗はやや遅れ気味であった。2022年度にはAIを活用した研究手法を導入したことで,研究をやや加速することができ,順調な進展となった。2023年度は研究成果にとりまとめおよび学会発表・学術論文の投稿を行うことができた。研究期間を延長し,2024年度には国際会議において研究成果の公開を行う。
|
今後の研究の推進方策 |
研究グループにおけるディスカッションおよび学会発表・論文投稿を通して,より効果的な特徴抽出手法を検討し,国会会議録と地方議会会議録の言語的特徴の分析結果をとりまとめていく予定である。
|