国会会議録コーパスと地方議会会議録コーパスを横断した言語的分析
Project/Area Number |
20K00576
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 02060:Linguistics-related
|
Research Institution | Utsunomiya Kyowa University |
Principal Investigator |
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
|
Co-Investigator(Kenkyū-buntansha) |
松田 謙次郎 神戸松蔭女子学院大学, 文学部, 教授 (40263636)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2022: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2020: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 地方議会会議録 / 国会会議録 / コーパス |
Outline of Research at the Start |
本研究では、地方議会会議録および国会会議録を横断的に取り扱い、発言者および発言者の属性に着目して「発話スタイルの変化」「方言語彙やオノマトペなどの使用」「政治関連語彙の使用」についての分析を行う。本研究で行う研究項目は以下のとおりである。 ① 同一人物の発言に着目し、言語的特徴を分析する。 ② 発言者の属性に基づいて、言語的特徴を分析する。 ③ 談話分析への展開を視野に入れ、議論の構造の分析を行う。
|
Outline of Annual Research Achievements |
2022年度には統一地方選挙を単位として構築している都道府県議会会議録2019ー2023期サブセットの速報版を作成し,議員別の発言特徴語の基礎的な分析を行った。今後,確定版を構築し,詳細な分析を行う予定である。 また,大規模コーパスからの言語的特徴の抽出の新しい試みとして,機械学習とXAI(説明可能な人工知能)技術を用いた分類手法を2022年6月の人工知能学会全国大会において提案した。提案手法を用いて地方議会会議録コーパスから方言的特徴を抽出する探索的方言調査手法の研究を進め,日本方言研究会の機関誌『方言の研究』に論文を投稿し採録された(2023年7月発刊予定)。この研究ではまず,入力文の発言地(都道府県)を自動推定する分類器を機械学習によって構築する。次に,XAI技術を用い,発言文のどの部分を手がかりに分類器が自動推定を行ったかを可視化する。可視化結果を分析し,発言地推定の手がかりとして方言がどの程度使用されているのかを考察する。発言地推定の手がかりの大半が地名や施設名,施策名であったものの,「はぐって」「特にも」「してみえる」等の方言を分類器が学習し,自動推定の手がかりとしていることが明らかになった。また,定型表現の地域差を見つけたり,方言を多用する話者を探すことにも役立つことが示唆された。AIを用いた大規模言語資源からの探索的方言研究の可能性を示した。現在,国会会議録と地方議会会議録の言語的特徴の比較に対しても同様の手法を適用し,研究を深化させているところである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
コロナ禍の影響で学会および研究打ち合わせにおける議論が十分に行えない期間が続いたため,研究期間を通して研究進捗はやや遅れ気味であった。2022年度にはAIを活用した研究手法を導入したことで,研究をやや加速することができ,順調な進展となった。 研究期間を1年間延長し,研究成果のとりまとめおよび学会発表・学術論文の投稿を行うよていである。
|
Strategy for Future Research Activity |
研究期間を1年間延長し,研究成果のとりまとめおよび学会発表・学術論文の投稿を行う。AI(人工知能技術)を導入した研究手法を活用して,これまで構築したデータセットの再分析を進め,国会会議録と地方議会会議録の言語的特徴の分析結果をとりまとめていく予定である。
|
Report
(3 results)
Research Products
(14 results)
-
-
-
-
-
-
-
-
-
[Presentation] NTCIR15 QA Lab-PoliInfo-2の報告およびデータセット公開2021
Author(s)
木村泰知, 渋木英潔, 高丸圭一, 内田ゆず, 乙武北斗, 石下円香, 三田村照子, 吉岡真治, 秋葉友良, 小川泰弘, 佐々木稔, 横手健一, 神門典子, 森辰則, 荒木健治, 関根聡
Organizer
言語処理学会第27回年次大会
Related Report
-
-
-
-
-