研究課題/領域番号 |
21H03769
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 小樽商科大学 |
研究代表者 |
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
|
研究分担者 |
川浦 昭彦 同志社大学, 政策学部, 教授 (10271610)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
佐々木 稔 茨城大学, 理工学研究科(工学野), 准教授 (60344834)
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
小川 泰弘 名古屋大学, 情報基盤センター, 准教授 (70332707)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
湯淺 墾道 明治大学, ガバナンス研究科, 専任教授 (60389400)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
16,380千円 (直接経費: 12,600千円、間接経費: 3,780千円)
2023年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2021年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
|
キーワード | 地方議会会議録 / 構造化データ / 非構造化データ / 政治情報 / 予算表 / コーパス / データセット / Linked Data / データ連結 / 議論の構造 / データの連結 |
研究開始時の研究の概要 |
本研究では、地方議会会議録(非構造化データ)を基盤として、さまざまな構造化データと連結した「拡張版 地方議会会議録コーパス」を構築することで、政治学、経済学、社会言語学、言語処理の応用研究を推進する。本研究で行う研究項目は、以下の通りである。 ①発言者の属性を整理し、政治的影響の検証を行う(政治学関連) ②発言内容と選挙結果を結びつけ、公共選択に関する分析を行う(経済学関連) ③発言文字列と発言音声を結びつけ、発話スタイルの変化を分析する(社会言語学関連) ④議論の構造に着目し、要約、分類、抽出に関する研究を行う(言語処理関連)
|
研究実績の概要 |
本研究では、地方議会会議録(非構造データ)を基盤として、さまざまな構造化データを結びつける「拡張版 地方議会会議録コーパス」を構築するとともに、本コーパスを用いて、政治学、経済学、社会言語学、言語処理の研究を推進することを目的としている。 本年度は、議論構造の分析、および、関連文書の自動アライメントについての研究を進めた。研究代表者、および、研究分担者は、地方議会会議録、議会だより、予算表などのデータを用いた Shared Task ( QA Lab-PoliInfo-3 ) を開催した。QA Lab-PoliInfo-3には、大学や民間企業などから13チームの参加があった。データセットについては、GitHub ( https://github.com/poliinfo3 ) 上で公開した。 また、2022年7月から2023年12月までの期間に実施される評価型ワークショップのNTCIR17に、政治情報を対象としたQA-Lab PoliInfo4タスク、および、有価証券報告書のテキストと表を扱うUFOタスクが採択された。QA-Lab PoliInfo4は、議会会議録を活用した4つのサブタスク(ファクトチェック、質問応答、スタンス分類、関係抽出)を提案した。UFOタスクでは、有価証券報告書に含まれる非構造化データを半構造化データへ変換するタスクを提案した。これらのタスクの詳細は、ウェブサイト( https://sites.google.com/view/poliinfo4/ 、https://sites.google.com/view/ntcir17-ufo/ ) により公開している。 他にも、政治学、経済学、社会言語学における研究に向けて、地方議会会議録のデータの収集および整理を進めている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
NTCIR16 QA Lab-PoliInfo-3 の Budget Argument Mining タスクにおいて、地方議会会議録(非構造化データ)を基盤として予算表(構造化データ)と結びつけるデータセットを構築した。また、経済学の研究では、議会会議録と選挙結果を用いた分析を進めた。さらに、日本経済評論社から書籍「自治体DX推進とオープンデータの活用」を出版した。
研究代表者、および、研究分担者は、地方議会会議録、議会だより、予算表などのデータを用いた Shared Task ( QA Lab-PoliInfo-3 ) を開催した。QA Lab-PoliInfo-3には、大学や民間企業などから13チームの参加があった。 この Shared Task に関する研究発表を研究会で行うとともに、結果をまとめて国際会議 LREC2022へ投稿した。データセットについては、GitHub ( https://github.com/poliinfo3 ) 上で公開した。
このことから、おおむね順調に進展しているといえる。
|
今後の研究の推進方策 |
本年度は、政治情報に関するNTICR-17 PoliInfo-4 タスク 、および、有価証券報告書に関する NTICR-17 UFO タスクを開催する。 PoliInfo-4 は、4つのサブタスクからなる議会会議録を対象としたタスクである。4つのサブタスクのなかでMinutes to Budget Linking (以下 MBLink)は、本研究課題に最も関連しており、議会における予算関連の発言(非構造化データ)を対象として、発言に関連する予算表をみつけることを目的としている。 また、NTICR-17 UFOは、有価証券報告書のテキストと表を対象としたタスクである。このタスクも、MBLink と同様に、本研究課題に関連しており、非構造化データと構造化データの連結を目的としたタスクである。申請者は、「拡張版 地方議会会議録コーパス」を活用して、これらのタスクのデータセットを構築するとともに、公開することで、政治学、経済学、社会言語学、言語処理の研究を推進する。
|