2020 Fiscal Year Research-status Report
国会会議録コーパスと地方議会会議録コーパスを横断した言語的分析
Project/Area Number |
20K00576
|
Research Institution | Utsunomiya Kyowa University |
Principal Investigator |
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
|
Co-Investigator(Kenkyū-buntansha) |
松田 謙次郎 神戸松蔭女子学院大学, 文学部, 教授 (40263636)
内田 ゆず 北海学園大学, 工学部, 准教授 (80583575)
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 地方議会会議録 / 国会会議録 / コーパス |
Outline of Annual Research Achievements |
2020年度初頭は新型コロナウイルス感染拡大に対応した研究体制や研究方法の構築を行うことに時間を要した。都道府県議会会議録の収集については,2011-2015期サブセットに続いて,2015-2019期サブセットの作成に取り組んだ。収集対象は全国47都道府県議会の本会議(定例会および臨時会)であり,収集期間は2015年4月の統一地方選挙から2019年4月の統一地方選挙の前(2019年3月)までの4年分である。都道府県議会はすべて,それぞれの自治体のWebサイトに会議録の全文検索システムを公開している。各全文検索システムに対応するクローラを作成して,会議録データの収集を行った。ただし,自治体ごとに検索システムや表示部分をカスタマイズしているため個別対応が必要であり,部分的に人手による作業も交えながら収集作業を行った。収集された全国47都道府県の本会議会議録を句点で1 発言ごとに分割し,それぞれの発言の発言者名を抽出した.そして,会議の名称や開催日等の情報と併せて1発言を1レコードとして格納した.総収録データは3,873,026レコードであった。発言の総文字数は248,281,520文字であった。選挙の当選者情報に議員IDを付与し,議会における発言者との名寄せを行った。また,国会会議録の収集を行い,整理を進めているところである。 これに加えて,オノマトペの使用に関する分析に向けて,オノマトペ辞典に掲載された用例と語義のデジタル化を集中的に行った。この結果,2020年度内にデジタルデータの作成を完了することができた。 これらの研究成果の一部を国際会議(未開催で予稿集のみ発行)および国内学会(オンライン開催)にて報告した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究課題に対する研究費の受け入れ時期が大幅に遅れたことに加え,年度初頭は新型コロナウイルス感染拡大に対応した研究体制や研究方法の構築を行うことに時間を要した。このため研究開始がずれこんだ。
|
Strategy for Future Research Activity |
コロナ禍での適切な研究体制,研究方法で研究を進める。
|
Causes of Carryover |
新型コロナウイルスへの対応で,研究費の受け入れおよび研究の開始が大幅に遅れたため。
|
Research Products
(7 results)
-
-
-
[Presentation] NTCIR15 QA Lab-PoliInfo-2の報告およびデータセット公開2021
Author(s)
木村泰知, 渋木英潔, 高丸圭一, 内田ゆず, 乙武北斗, 石下円香, 三田村照子, 吉岡真治, 秋葉友良, 小川泰弘, 佐々木稔, 横手健一, 神門典子, 森辰則, 荒木健治, 関根聡
Organizer
言語処理学会第27回年次大会
-
-
-
-