2020 Fiscal Year Annual Research Report
Quantitative Analysis of Textual Corpus with Geometric Information Focused on the Local Assembly Minutes
Project/Area Number |
17K02739
|
Research Institution | Utsunomiya Kyowa University |
Principal Investigator |
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
|
Co-Investigator(Kenkyū-buntansha) |
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
内田 ゆず 北海学園大学, 工学部, 准教授 (80583575)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
吉田 光男 豊橋技術科学大学, 工学(系)研究科(研究院), 助教 (60734978)
井上 史雄 東京外国語大学, その他部局等, 名誉教授 (40011332)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 地方議会会議録 / 方言談話資料 / 位置情報付きツイート / データベース |
Outline of Annual Research Achievements |
本研究は地方議会会議録(全国47都道府県議会の会議録),方言談話資料(具体的には「NHK全国方言資料」),発言地域が明らかなウェブテキスト(具体的には,位置情報付きツイート)のデータベース化,分析の枠組みの構築を進めるものである。当初予定していた研究期間は平成29年度から令和元年度までであったが,新型コロナウイルス感染拡大の影響で研究成果のとりまとめを令和元年度内に行うことができなったため研究期間を延長した。 方言談話資料については電子化を行った上で,1文節を1レコードとし,地名,GEOタグ,談話カテゴリ,発話者コード,割込発話フラグ,方言形,共通語形の項目をデータベース化した。正規表現による検索によって,同一の共通語の方言形を洗い出すことが可能であることを明らかにした。位置情報付きツイートについてはテキストマイニングの手法を用いて,発言の地域と出現語の共起について分析を行った。地方議会会議録についてはこれまで2015年の統一地方選挙以前(2015年3月まで)のデータを対象としていたが,2019年の統一地方選挙まで(2019年3月まで)の会議録を追加で収集・整形した。これにより経時的な分析がより幅広く行えるようになった。地方議会における議論は一括質問一括答弁の方式で行われることがある。個々の質問に対する答弁を明らかにするために,地方議会会議録における議論の構造に関する分析を行った。これらの研究の成果の一部を国際会議の論文として発表した。
|
-
-
-
[Presentation] NTCIR15 QA Lab-PoliInfo-2の報告およびデータセット公開2021
Author(s)
木村泰知, 渋木英潔, 高丸圭一, 内田ゆず, 乙武北斗, 石下円香, 三田村照子, 吉岡真治, 秋葉友良, 小川泰弘, 佐々木稔, 横手健一, 神門典子, 森辰則, 荒木健治, 関根聡
Organizer
言語処理学会第27回年次大会
-
-
-
-
-