2022 Fiscal Year Research-status Report
国会会議録コーパスと地方議会会議録コーパスを横断した言語的分析
Project/Area Number |
20K00576
|
Research Institution | Utsunomiya Kyowa University |
Principal Investigator |
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
|
Co-Investigator(Kenkyū-buntansha) |
松田 謙次郎 神戸松蔭女子学院大学, 文学部, 教授 (40263636)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 地方議会会議録 / 国会会議録 / コーパス |
Outline of Annual Research Achievements |
2022年度には統一地方選挙を単位として構築している都道府県議会会議録2019ー2023期サブセットの速報版を作成し,議員別の発言特徴語の基礎的な分析を行った。今後,確定版を構築し,詳細な分析を行う予定である。 また,大規模コーパスからの言語的特徴の抽出の新しい試みとして,機械学習とXAI(説明可能な人工知能)技術を用いた分類手法を2022年6月の人工知能学会全国大会において提案した。提案手法を用いて地方議会会議録コーパスから方言的特徴を抽出する探索的方言調査手法の研究を進め,日本方言研究会の機関誌『方言の研究』に論文を投稿し採録された(2023年7月発刊予定)。この研究ではまず,入力文の発言地(都道府県)を自動推定する分類器を機械学習によって構築する。次に,XAI技術を用い,発言文のどの部分を手がかりに分類器が自動推定を行ったかを可視化する。可視化結果を分析し,発言地推定の手がかりとして方言がどの程度使用されているのかを考察する。発言地推定の手がかりの大半が地名や施設名,施策名であったものの,「はぐって」「特にも」「してみえる」等の方言を分類器が学習し,自動推定の手がかりとしていることが明らかになった。また,定型表現の地域差を見つけたり,方言を多用する話者を探すことにも役立つことが示唆された。AIを用いた大規模言語資源からの探索的方言研究の可能性を示した。現在,国会会議録と地方議会会議録の言語的特徴の比較に対しても同様の手法を適用し,研究を深化させているところである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
コロナ禍の影響で学会および研究打ち合わせにおける議論が十分に行えない期間が続いたため,研究期間を通して研究進捗はやや遅れ気味であった。2022年度にはAIを活用した研究手法を導入したことで,研究をやや加速することができ,順調な進展となった。 研究期間を1年間延長し,研究成果のとりまとめおよび学会発表・学術論文の投稿を行うよていである。
|
Strategy for Future Research Activity |
研究期間を1年間延長し,研究成果のとりまとめおよび学会発表・学術論文の投稿を行う。AI(人工知能技術)を導入した研究手法を活用して,これまで構築したデータセットの再分析を進め,国会会議録と地方議会会議録の言語的特徴の分析結果をとりまとめていく予定である。
|
Causes of Carryover |
実施予定(参加予定)であった共同研究者間の打ち合わせや学会発表等の対面でのディスカッションを十分に行えなかったため繰越が生じた。これらは2023年度に時期をずらして実施する予定である。
|
Research Products
(7 results)