| 研究課題/領域番号 |
23K21841
|
| 補助金の研究課題番号 |
21H03769 (2021-2023)
|
| 研究種目 |
基盤研究(B)
|
| 配分区分 | 基金 (2024) 補助金 (2021-2023) |
| 応募区分 | 一般 |
| 審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
| 研究機関 | 小樽商科大学 |
研究代表者 |
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
|
| 研究分担者 |
川浦 昭彦 同志社大学, 政策学部, 教授 (10271610)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
佐々木 稔 茨城大学, 応用理工学野, 准教授 (60344834)
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
湯淺 墾道 明治大学, ガバナンス研究科, 専任教授 (60389400)
小川 泰弘 名古屋市立大学, データサイエンス学部, 准教授 (70332707)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
|
| 研究期間 (年度) |
2024-04-01 – 2025-03-31
|
| 研究課題ステータス |
完了 (2024年度)
|
| 配分額 *注記 |
16,380千円 (直接経費: 12,600千円、間接経費: 3,780千円)
2024年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2023年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2021年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
|
| キーワード | 地方議会会議録 / 非構造化データ / 構造化データ / 表 / 有価証券報告書 / データ連結 / 表構造認識 / データの連結 / 政治情報 / 予算表 / コーパス / データセット / Linked Data / 議論の構造 |
| 研究開始時の研究の概要 |
本研究では、地方議会会議録(非構造化データ)を基盤として、さまざまな構造化データと連結した「拡張版 地方議会会議録コーパス」を構築することで、政治学、経済学、社会言語学、言語処理の応用研究を推進する。本研究で行う研究項目は、以下の通りである。 ①発言者の属性を整理し、政治的影響の検証を行う(政治学関連) ②発言内容と選挙結果を結びつけ、公共選択に関する分析を行う(経済学関連) ③発言文字列と発言音声を結びつけ、発話スタイルの変化を分析する(社会言語学関連) ④議論の構造に着目し、要約、分類、抽出に関する研究を行う(言語処理関連)
|
| 研究成果の概要 |
本研究では、地方議会会議録(非構造化データ)を基盤として、さまざまな構造化データと連結した「拡張版 地方議会会議録コーパス」を構築することで、政治学、経済学、社会言語学、言語処理の応用研究を推進する。本研究で行う研究項目は、以下の通りである。①発言者の属性を整理し、政治的影響の検証を行う(政治学関連)②発言内容と選挙結果を結びつけ、公共選択に関する分析を行う(経済学関連)③発言文字列と発言音声を結びつけ、発話スタイルの変化を分析する(社会言語学関連)④議論の構造に着目し、要約、分類、抽出に関する研究を行う(言語処理関連)
|
| 研究成果の学術的意義や社会的意義 |
本研究は、710自治体の議会会議録をもとに大規模言語モデルを構築するとともに、非構造化発言と構造化表データを連結する技術を開発し、政治・経済・子育て支援など異分野へ応用できる汎用的基盤を提示した。学術的には、地方議会という未開拓領域の言語資源を体系化し、議事内容と選挙結果や財務情報を横断的に分析可能とした点で自然言語処理と社会科学の橋渡しを果たす。社会的には、子育て支援評価や公開状況の地域差可視化を通じ、地方自治体の情報公開と政策形成の高度化に寄与し、住民の知る権利と行政の説明責任を強化する。さらに、公開データの地域差を定量化し、今後のコーパス拡張戦略とオープンデータ政策の課題を明示した。
|