Project/Area Number |
20K00576
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 02060:Linguistics-related
|
Research Institution | Utsunomiya Kyowa University |
Principal Investigator |
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
|
Co-Investigator(Kenkyū-buntansha) |
松田 謙次郎 神戸松蔭女子学院大学, 文学部, 教授 (40263636)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2022: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2020: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 地方議会会議録 / 国会会議録 / コーパス / XAI |
Outline of Research at the Start |
本研究では、地方議会会議録および国会会議録を横断的に取り扱い、発言者および発言者の属性に着目して「発話スタイルの変化」「方言語彙やオノマトペなどの使用」「政治関連語彙の使用」についての分析を行う。本研究で行う研究項目は以下のとおりである。 ① 同一人物の発言に着目し、言語的特徴を分析する。 ② 発言者の属性に基づいて、言語的特徴を分析する。 ③ 談話分析への展開を視野に入れ、議論の構造の分析を行う。
|
Outline of Annual Research Achievements |
地方議会会議録と国会会議録を対象としたXAIによる特徴表現の可視化を試みた。まず,BERTを用い,入力文が地方議会会議録であるか国会会議録を分類する2値分類器を構築した。次に,Integrated Gradientsに代表される推論結果を説明する手法を用い,入力文における各トークンの分類貢献度を算出し,どの部分を手がかりに分類器が推定を行ったかを可視化した。可視化結果を分析し,推定の手がかりとなった部分にどのような表現が存在するかを考察した。 この結果、国会会議録の正例では国会らしい語彙や国政特有のフレーズが,地方議会会議録の正例では地方議会らしい語彙や地方行政特有のフレーズがそれぞれポジティブの貢献をするトークンとして可視化されていることが確認された。国会会議録と地方議会会議録の差異として,漢字の送り仮名(「取組」,「取り組み」),数字の表記(漢数字,アラビア数字),入力文の区切り方(入力文中の句点)などが観察された。他方で,可視化結果には解釈が難しいと考えられるケースが多様に存在することも明らかになった。 XAIによる可視化が特徴分析の手助けとなると考えられるものの,可視化結果と人間が特徴的であると捉える文字列は十分に一致しない。種々のXAIの手法を子細に比較したり,XAIの出力を後処理することで可視化手法を高度化することで,機械学習の専門家以外にも利用しやすいコーパス間の特徴分析手法の検討を進めていく必要があると考えられる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
コロナ禍の影響で学会および研究打ち合わせにおける議論が十分に行えない期間が続いたため,研究期間を通して研究進捗はやや遅れ気味であった。2022年度にはAIを活用した研究手法を導入したことで,研究をやや加速することができ,順調な進展となった。2023年度は研究成果にとりまとめおよび学会発表・学術論文の投稿を行うことができた。研究期間を延長し,2024年度には国際会議において研究成果の公開を行う。
|
Strategy for Future Research Activity |
研究グループにおけるディスカッションおよび学会発表・論文投稿を通して,より効果的な特徴抽出手法を検討し,国会会議録と地方議会会議録の言語的特徴の分析結果をとりまとめていく予定である。
|