研究課題/領域番号 |
23K21841
|
補助金の研究課題番号 |
21H03769 (2021-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2021-2023) |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 小樽商科大学 |
研究代表者 |
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
|
研究分担者 |
川浦 昭彦 同志社大学, 政策学部, 教授 (10271610)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
佐々木 稔 茨城大学, 理工学研究科(工学野), 准教授 (60344834)
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
湯淺 墾道 明治大学, ガバナンス研究科, 専任教授 (60389400)
小川 泰弘 名古屋市立大学, データサイエンス学部, 准教授 (70332707)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
16,380千円 (直接経費: 12,600千円、間接経費: 3,780千円)
2024年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2023年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2021年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
|
キーワード | 地方議会会議録 / 構造化データ / 非構造化データ / データの連結 / データ連結 / 政治情報 / 予算表 / コーパス / データセット / Linked Data / 議論の構造 |
研究開始時の研究の概要 |
本研究では、地方議会会議録(非構造化データ)を基盤として、さまざまな構造化データと連結した「拡張版 地方議会会議録コーパス」を構築することで、政治学、経済学、社会言語学、言語処理の応用研究を推進する。本研究で行う研究項目は、以下の通りである。 ①発言者の属性を整理し、政治的影響の検証を行う(政治学関連) ②発言内容と選挙結果を結びつけ、公共選択に関する分析を行う(経済学関連) ③発言文字列と発言音声を結びつけ、発話スタイルの変化を分析する(社会言語学関連) ④議論の構造に着目し、要約、分類、抽出に関する研究を行う(言語処理関連)
|
研究実績の概要 |
本研究では、地方議会会議録(非構造データ)を基盤として、さまざまな構造化データを結びつける「拡張版地方議会会議録コーパス」を構築するとともに、本コーパスを用いて、政治学、経済学、社会言語学、言語処理の研究を推進することを目的としている。
本年度は、議論構造の分析および関連する文書と表の自動アライメントについての研究を進めた。研究代表者および研究分担者は、地方議会会議録、議会だより、予算表などのデータを用いたQA-Lab PoliInfo4タスク、および有価証券報告書のテキストと表を扱うUFOタスクを実施した。QA-Lab PoliInfo4では、議会会議録を活用した4つのサブタスク(ファクトチェック、質問応答、スタンス分類、関係抽出)を提案した。UFOタスクでは、有価証券報告書に含まれる非構造化データを半構造化データへ変換するタスクを実施した。これらのタスクの詳細は、ウェブサイト(https://sites.google.com/view/poliinfo4/ および https://sites.google.com/view/ntcir17-ufo/)にて公開している。
また、政治学、経済学との研究成果を出しており、査読付き論文として採録された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
NTCIR17 QA Lab-PoliInfo-4 の MBLink タスクにおいて、地方議会会議録(非構造化データ)を基盤として予算表(構造化データ)と紐づけるデータセットを構築した。また、UFOタスクでは、有価証券報告書に含まれる非構造化データを半構造化データへ変換するタスクを実施した。他にも、経済学の研究では、議会会議録と選挙結果を用いた分析を進め、論文投稿をした。
|
今後の研究の推進方策 |
今後は、Shared Tasks としてNTCIR-18 の有価証券報告書に関連タスクについての企画・運営を行っており、その結果を議会会議録にも応用する予定である。また、政治学、経済学、社会言語学における研究に向けて、地方議会会議録のデータの収集および整理を進めている。
|