2018 Fiscal Year Research-status Report
地方議会会議録を核とした発言地域情報付きテキストコーパスの定量分析
Project/Area Number |
17K02739
|
Research Institution | Utsunomiya Kyowa University |
Principal Investigator |
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
|
Co-Investigator(Kenkyū-buntansha) |
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
内田 ゆず 北海学園大学, 工学部, 准教授 (80583575)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
吉田 光男 豊橋技術科学大学, 工学(系)研究科(研究院), 助教 (60734978)
井上 史雄 東京外国語大学, その他部局等, 名誉教授 (40011332)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 地方議会会議録 / 位置情報付きツイート / 方言談話資料 / データベース |
Outline of Annual Research Achievements |
平成30年度には,「全国方言資料CD-ROM版」(NHK出版)に収録されている画像資料の文字化,データベース化を進めた。まず,データ形式について検討を行った。この結果,収録内容については,「ファイル名」「大分類」「番号」「小分類」「ページ」「出演者」「括弧内」「発音」「標準語」の9つのフィールドを持つテーブルに格納することとした。また「ファイル名」「大分類」「番号」「小分類」「出演者」「氏名」「生年」「職業」の8つのフィールドを持つテーブルに格納することとした。 また,地方議会会議録については,分析期間,分析範囲の統制が取れるように,サブセットの作成を行った。議員については選挙において公開された情報に基づいて,発言者属性(生年,性別,選挙区)を付与し,詳細な分析を行えるようにした。このサブセットを対象に,対数尤度比を用いて議員の属性ごとの特徴語を抽出し,議員の属性による発言内容の違いを考察した。また,特定の分野における発言の特徴を定量的に分析するためにBCCWJに基づく専門分野語彙度(今年度の研究では政治語彙度)の考え方を提案した。これらの成果を査読付論文として『知能と情報』誌において公表した。 全国方言資料および地方議会会議録に加えて,位置情報付きツイートデータを利用して,地方議会会議録,方言談話資料,位置情報付きツイートの横断的定量分析を進めた。この成果の一部を,人工知能学会全国大会,国際会議(LREC2018)等で発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成30年度には分析対象である3つのデータについて,データベース化の目処が整い,分析を開始することができた。このため,順調に進捗していると考えられる。ただし,現在のところ,個別の分析にとどまっているところである。横断的検索を適切に進めるために,令和元年度には共同研究者との連携を蜜にしたい。
|
Strategy for Future Research Activity |
現在のところ,それぞれの資料の分析を分担して行っているところである。共同研究者との連携を蜜にすることで,地方議会会議録を核に,方言談話資料,位置情報付きツイートを横断的に分析していく予定である。
|
Causes of Carryover |
方言語彙分析を今年度から次年度にかけて継続的に実施中であり,作業のための人件費の一部と,打ち合わせのための旅費の一部が次年度繰越となった。
|
Research Products
(9 results)