| Project/Area Number |
23K21841
|
| Project/Area Number (Other) |
21H03769 (2021-2023)
|
| Research Category |
Grant-in-Aid for Scientific Research (B)
|
| Allocation Type | Multi-year Fund (2024) Single-year Grants (2021-2023) |
| Section | 一般 |
| Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
| Research Institution | Otaru University of Commerce |
Principal Investigator |
|
| Co-Investigator(Kenkyū-buntansha) |
川浦 昭彦 同志社大学, 政策学部, 教授 (10271610)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
佐々木 稔 茨城大学, 応用理工学野, 准教授 (60344834)
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
湯淺 墾道 明治大学, ガバナンス研究科, 専任教授 (60389400)
小川 泰弘 名古屋市立大学, データサイエンス学部, 准教授 (70332707)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
|
| Project Period (FY) |
2024-04-01 – 2025-03-31
|
| Project Status |
Completed (Fiscal Year 2024)
|
| Budget Amount *help |
¥16,380,000 (Direct Cost: ¥12,600,000、Indirect Cost: ¥3,780,000)
Fiscal Year 2024: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2023: ¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2022: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2021: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
|
| Keywords | 地方議会会議録 / 非構造化データ / 構造化データ / 表 / 有価証券報告書 / データ連結 / 表構造認識 / データの連結 / 政治情報 / 予算表 / コーパス / データセット / Linked Data / 議論の構造 |
| Outline of Research at the Start |
本研究では、地方議会会議録(非構造化データ)を基盤として、さまざまな構造化データと連結した「拡張版 地方議会会議録コーパス」を構築することで、政治学、経済学、社会言語学、言語処理の応用研究を推進する。本研究で行う研究項目は、以下の通りである。 ①発言者の属性を整理し、政治的影響の検証を行う(政治学関連) ②発言内容と選挙結果を結びつけ、公共選択に関する分析を行う(経済学関連) ③発言文字列と発言音声を結びつけ、発話スタイルの変化を分析する(社会言語学関連) ④議論の構造に着目し、要約、分類、抽出に関する研究を行う(言語処理関連)
|
| Outline of Final Research Achievements |
This study aims to advance applied research in political science, economics, sociolinguistics, and language processing by constructing an Expanded Local Assembly Minutes Corpus that links unstructured local assembly minutes with a variety of structured datasets. The project comprises the following four research components: 1. Political Science ; Systematize speaker attributes and evaluate their political influence. 2. Economics ; Relate speech content to election outcomes and analyze public choice dynamics. 3. Sociolinguistics ; Align transcribed speech with corresponding audio to investigate changes in speech style. 4. Language Processing ; Examine debate structure and conduct studies on summarization, classification, and information extraction.
|
| Academic Significance and Societal Importance of the Research Achievements |
本研究は、710自治体の議会会議録をもとに大規模言語モデルを構築するとともに、非構造化発言と構造化表データを連結する技術を開発し、政治・経済・子育て支援など異分野へ応用できる汎用的基盤を提示した。学術的には、地方議会という未開拓領域の言語資源を体系化し、議事内容と選挙結果や財務情報を横断的に分析可能とした点で自然言語処理と社会科学の橋渡しを果たす。社会的には、子育て支援評価や公開状況の地域差可視化を通じ、地方自治体の情報公開と政策形成の高度化に寄与し、住民の知る権利と行政の説明責任を強化する。さらに、公開データの地域差を定量化し、今後のコーパス拡張戦略とオープンデータ政策の課題を明示した。
|