Project/Area Number |
23K21841
|
Project/Area Number (Other) |
21H03769 (2021-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2021-2023) |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | Otaru University of Commerce |
Principal Investigator |
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
|
Co-Investigator(Kenkyū-buntansha) |
川浦 昭彦 同志社大学, 政策学部, 教授 (10271610)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
佐々木 稔 茨城大学, 理工学研究科(工学野), 准教授 (60344834)
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
湯淺 墾道 明治大学, ガバナンス研究科, 専任教授 (60389400)
小川 泰弘 名古屋市立大学, データサイエンス学部, 准教授 (70332707)
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥16,380,000 (Direct Cost: ¥12,600,000、Indirect Cost: ¥3,780,000)
Fiscal Year 2024: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2023: ¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2022: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2021: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
|
Keywords | 地方議会会議録 / 構造化データ / 非構造化データ / データの連結 / データ連結 / 政治情報 / 予算表 / コーパス / データセット / Linked Data / 議論の構造 |
Outline of Research at the Start |
本研究では、地方議会会議録(非構造化データ)を基盤として、さまざまな構造化データと連結した「拡張版 地方議会会議録コーパス」を構築することで、政治学、経済学、社会言語学、言語処理の応用研究を推進する。本研究で行う研究項目は、以下の通りである。 ①発言者の属性を整理し、政治的影響の検証を行う(政治学関連) ②発言内容と選挙結果を結びつけ、公共選択に関する分析を行う(経済学関連) ③発言文字列と発言音声を結びつけ、発話スタイルの変化を分析する(社会言語学関連) ④議論の構造に着目し、要約、分類、抽出に関する研究を行う(言語処理関連)
|
Outline of Annual Research Achievements |
本研究では、地方議会会議録(非構造データ)を基盤として、さまざまな構造化データを結びつける「拡張版地方議会会議録コーパス」を構築するとともに、本コーパスを用いて、政治学、経済学、社会言語学、言語処理の研究を推進することを目的としている。
本年度は、議論構造の分析および関連する文書と表の自動アライメントについての研究を進めた。研究代表者および研究分担者は、地方議会会議録、議会だより、予算表などのデータを用いたQA-Lab PoliInfo4タスク、および有価証券報告書のテキストと表を扱うUFOタスクを実施した。QA-Lab PoliInfo4では、議会会議録を活用した4つのサブタスク(ファクトチェック、質問応答、スタンス分類、関係抽出)を提案した。UFOタスクでは、有価証券報告書に含まれる非構造化データを半構造化データへ変換するタスクを実施した。これらのタスクの詳細は、ウェブサイト(https://sites.google.com/view/poliinfo4/ および https://sites.google.com/view/ntcir17-ufo/)にて公開している。
また、政治学、経済学との研究成果を出しており、査読付き論文として採録された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
NTCIR17 QA Lab-PoliInfo-4 の MBLink タスクにおいて、地方議会会議録(非構造化データ)を基盤として予算表(構造化データ)と紐づけるデータセットを構築した。また、UFOタスクでは、有価証券報告書に含まれる非構造化データを半構造化データへ変換するタスクを実施した。他にも、経済学の研究では、議会会議録と選挙結果を用いた分析を進め、論文投稿をした。
|
Strategy for Future Research Activity |
今後は、Shared Tasks としてNTCIR-18 の有価証券報告書に関連タスクについての企画・運営を行っており、その結果を議会会議録にも応用する予定である。また、政治学、経済学、社会言語学における研究に向けて、地方議会会議録のデータの収集および整理を進めている。
|