• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Research-status Report

地方議会会議録を核とした発言地域情報付きテキストコーパスの定量分析

Research Project

Project/Area Number 17K02739
Research InstitutionUtsunomiya Kyowa University

Principal Investigator

高丸 圭一  宇都宮共和大学, シティライフ学部, 准教授 (60383121)

Co-Investigator(Kenkyū-buntansha) 木村 泰知  小樽商科大学, 商学部, 准教授 (50400073)
内田 ゆず  北海学園大学, 工学部, 准教授 (80583575)
乙武 北斗  福岡大学, 工学部, 助教 (20580179)
井上 史雄  東京外国語大学, その他部局等, 名誉教授 (40011332)
Project Period (FY) 2017-04-01 – 2020-03-31
Keywords地方議会会議録 / 位置情報付きツイート / 方言資料 / 横断検索
Outline of Annual Research Achievements

平成29年度は,研究計画のうち「(Ⅰ)データ収集」を行った上で,「(Ⅱ)分析準備」を進めた。1つ目の分析対象である議会会議録については,すでにデータ収集済みの47都道府県の地方議会会議録コーパス(平成23年度から27年度まで)における発言者の名寄せ(表記揺れの修正および識別コードの付与)・肩書きの整理を行った。また,議員の属性情報(性別・生年等)を整理した上で,発言データと属性情報の対応関係を明らかにした。この成果については,国際会議等で公表した(高丸・内田・木村)。
2つ目の分析対象である方言談話資料については,電子化されて出版されている全国方言談話データベース「日本のふるさとことば集成」CD-ROM(国立国語研究所編)に収録されているテキストデータを用いて,データベース化・可視化システムの実装に向けた検討を行った(乙武・高丸)。また,「全国方言資料CD-ROM版」(NHK出版)を対象に,画像データとして収録されている情報のテキスト化に向けた準備を進めた(井上・高丸)。
3つ目の分析対象である位置情報付き大規模WEBデータの収集にあたり,研究分担者として豊橋技科大の吉田助教に新たに加わっていただき,氏が既に構築済みの収集システムおよび既に収集している位置情報付きツイートを分析データとして使用することとした。有機的な研究協力によって,データ収集システムの構築等を新たに行う必要がなくなったため,その分,分析に向けた準備に注力できる結果となった。位置情報付きツイートの一部を利用して,データベース化・可視化の予備実験を行った(吉田・高丸・乙武)。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究課題における平成29年度の研究計画は,①地方議会会議録,②方言談話資料,③位置情報付き大規模WEBデータを対象として,(Ⅰ)データ収集を行った上で,(Ⅱ)分析準備を開始することであった。
①~③のデータ収集を概ね進めることができたため,研究計画(Ⅰ)については順調に進めることができたといえる。また,①地方議会会議録については,話者属性ごとの分析に向けて,情報の付与を適切に進めることができた。②方言談話資料については,小規模データに対する予備的な準備を進めた。画像データとして保有している資料のテキスト化は平成30年度に進める必要がある。③位置情報付き大規模WEBデータについては,データの収集は順調に行われた。また,データベース化,可視化についての予備実験を29年度中に実施することができた。また,先行研究に関する調査にも成果があった。このことから,全体としておおむね順調+α程度の進捗状況と考える。

Strategy for Future Research Activity

平成30年度以降も,原則的には当初の研究計画に従って,研究を進めていく。データの準備作業を進め,収集データをデータベースマネジメントシステムに登録し,ウェブベースでの横断検索,KWIC表示,クロス集計,出現頻度の可視化(地図化)を行える仕組みを整える。これまでに構築した地方議会会議録コーパスを対象とした同様のシステムを部分的に変更し、データおよびその出典、都道府県名、細かい地域名、(情報が分かる場合には)話者属性を登録できるようにする。その後,方言語彙分布の可視化,単語出現頻度の統計分析,テキストマイニング手法による言語特徴の洗い出しなどの分析を進めて行く予定である。

Causes of Carryover

研究計画では,方言談話資料のデータ準備(テキスト化)など,平成29年度から30年度にまたがって実施している研究が複数存在する。これにかかる人件費や打ち合わせのための旅費等が会計年度の区分の上で平成29年度内に支出されなかったため,次年度への繰越が生じた。
研究計画どおりの支出を行った上で,会計区分上の繰越額が生じているだけなので,平成30年度以降も研究計画通りに研究を進める。

  • Research Products

    (6 results)

All 2017

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (5 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] A Web-Based Visualization System for Interdisciplinary Research Using Japanese Local Political Corpus2017

    • Author(s)
      Hokuto Ototake, Hiroki Sakaji, Keiichi Takamaru, Akio Kobayashi, Yuzu Uchida, Yasutomo Kimura
    • Journal Title

      Lecture Notes on Data Engineering and Communications Technologies

      Volume: - Pages: 1076-1085

    • DOI

      https://doi.org/10.1007/978-3-319-65521-5_99

    • Peer Reviewed
  • [Presentation] Demonstration of the Online Local Assembly Minutes2017

    • Author(s)
      Keiichi Takamaru
    • Organizer
      Workshop 5: Hansards as a dialectal resource, the Sixteenth International Conference on Methods in Dialectology (METHODS XVI)
    • Int'l Joint Research
  • [Presentation] 全地方議会会議録の横断検索に向けたデータ収集とデータ構造の検討2017

    • Author(s)
      井原 大将, 内田 ゆず, 高丸 圭一, 木村 泰知, 江崎 浩
    • Organizer
      情報処理学会第233回自然言語処理研究会
  • [Presentation] 都道府県議会会議録のパネルデータ作成に向けた発言者情報の付与2017

    • Author(s)
      木村泰知, 内田ゆず, 高丸圭一
    • Organizer
      第33回ファジィシステムシンポジウム講演論文集
  • [Presentation] 都道府県議会会議録を対象とした議題・議案表現の自動抽出に向けた検討2017

    • Author(s)
      田中琢真,小林暁雄,坂地泰紀,内田ゆず,乙武北斗,高丸圭一,木村泰知,増山繁
    • Organizer
      第31回人工知能学会全国大会
  • [Presentation] 議論の背景・過程・結果を関連づける地方政治コーパスの構築の試み2017

    • Author(s)
      木村泰知,小林暁雄,坂地泰紀,内田ゆず,高丸圭一,乙武北斗,吉田光男,荒木健治
    • Organizer
      第31回人工知能学会全国大会

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi