Project/Area Number |
23K22076
|
Project/Area Number (Other) |
22H00804 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 06010:Politics-related
|
Research Institution | Shizuoka University |
Principal Investigator |
狩野 芳伸 静岡大学, 情報学部, 准教授 (20506729)
|
Co-Investigator(Kenkyū-buntansha) |
三輪 洋文 学習院大学, 法学部, 教授 (20780258)
岸本 泰士郎 慶應義塾大学, 医学部(信濃町), 特任教授 (60348745)
野中 尚人 学習院大学, 法学部, 教授 (90264697)
五十嵐 彰 大阪大学, 大学院人間科学研究科, 准教授 (90844762)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,290,000 (Direct Cost: ¥13,300,000、Indirect Cost: ¥3,990,000)
Fiscal Year 2026: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2025: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2024: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2023: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2022: ¥3,770,000 (Direct Cost: ¥2,900,000、Indirect Cost: ¥870,000)
|
Keywords | 世論形成過程 / 人工知能 / SNS / 自然言語処理 / 世論形成 / 議事録 / メディア |
Outline of Research at the Start |
世論が政治家の言動や政治的出来事に対して合理的に反応しているかを検証することは、現代民主主義においてアカウンタビリティが確保されているかをチェックする上で重要な課題である。本研究では、SNSデータ(引用された新聞記事を含む)と国会議事録(文字・映像)を対象に、機械学習による精細な話し言葉解析器と心理状態分析器・嘘検出器を用いて、これら情報の受信・発信者の状態とその変化をミクロで推測する。さらにマクロな集団としての我が国の世論形成過程、政府・政治家と世論の関係を時系列モデルで分析し、可視化する。具体的なテーマとしては対外国人意識を重点的に扱う。
|
Outline of Annual Research Achievements |
前年度に引き続き、SNS投稿データ・議事録・新聞記事のそれぞれについて、大規模言語モデルの事前学習とファインチューンを試みた。 議会議事録に関しては、shared task(コンテスト)の集合体である国際会議NTCIR-17のQA Lab-PoliInfo-4タスクに参加して、Stance Classificationサブタスクにおいて参加者中首位の成績を収めた。このサブタスクは、地方自治体議事録において発言した各議員の賛否の自動推測を行い、タスク運営側が提供するデータを用いて参加者間の性能評価を競うもので、我々は同ドメインデータの段階的事前学習が有効であることを示した。 SNS投稿データの収集については利用する商用サービスの利用規定変更により予定の変更を余儀なくされたが、主に収集済みの投稿データとクラウドソーシング調査結果に基づき、オンラインアカウントの各種属性推測を行った。我々が独自に進めているクラウドソーシング調査は、アクティブに投稿を行っているSNSユーザに対し、投稿データを収集するとともに様々な個人的、政治的属性についてアンケートに答えてもらうものである。また、テキスト間の論理的関係性判断の基盤となる含意関係認識の研究を進めるとともに、含意関係認識システムの性能向上を確認した。さらに、大規模SNSデータによる言語モデルの事前学習を行い、大規模SNSデータで学習されたこれまでに最も高い性能を報告しているモデルを多くのタスク評価で上回る性能を達成した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
SNS投稿データの収集については商用サービスの利用規定変更により方針変更を余儀なくされたが、主に収集済みの投稿データとクラウドソーシング調査結果に基づき、おおむね予定通りの研究を進めることができた。
|
Strategy for Future Research Activity |
前年度に引き続き、SNS投稿データ・国会議事録・新聞記事のそれぞれについて、大規模言語モデルの事前学習と適用、性能向上を試みる。 含意関係・矛盾関係の自動判定のため、本研究に適したデータセットの構築を試みるとともに、現実的な設定においてどのようなパターンがあり、どのような課題がありうるか探求する。 ファインチューニングとして、SNS投稿がどの程度評価・引用されるかについて、時系列を加味した推測と、政党や政策の支持率を推測するタスク設定で学習と評価を行う。 なお、代表者は自然言語処理および機械学習部分を、分担者(野中・三輪)は政党政策の支持率およびその調査に関連する政治学的分析部分を、分担者(五十嵐)は対外国人意識の調査部分を、分担者(岸本)はSNS投稿のユーザ分析部分を、それぞれ担当する。
|