• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

地方議会会議録を核とした発言地域情報付きテキストコーパスの定量分析

研究課題

研究課題/領域番号 17K02739
研究機関宇都宮共和大学

研究代表者

高丸 圭一  宇都宮共和大学, シティライフ学部, 准教授 (60383121)

研究分担者 木村 泰知  小樽商科大学, 商学部, 准教授 (50400073)
内田 ゆず  北海学園大学, 工学部, 准教授 (80583575)
乙武 北斗  福岡大学, 工学部, 助教 (20580179)
井上 史雄  東京外国語大学, その他部局等, 名誉教授 (40011332)
研究期間 (年度) 2017-04-01 – 2020-03-31
キーワード地方議会会議録 / 位置情報付きツイート / 方言資料 / 横断検索
研究実績の概要

平成29年度は,研究計画のうち「(Ⅰ)データ収集」を行った上で,「(Ⅱ)分析準備」を進めた。1つ目の分析対象である議会会議録については,すでにデータ収集済みの47都道府県の地方議会会議録コーパス(平成23年度から27年度まで)における発言者の名寄せ(表記揺れの修正および識別コードの付与)・肩書きの整理を行った。また,議員の属性情報(性別・生年等)を整理した上で,発言データと属性情報の対応関係を明らかにした。この成果については,国際会議等で公表した(高丸・内田・木村)。
2つ目の分析対象である方言談話資料については,電子化されて出版されている全国方言談話データベース「日本のふるさとことば集成」CD-ROM(国立国語研究所編)に収録されているテキストデータを用いて,データベース化・可視化システムの実装に向けた検討を行った(乙武・高丸)。また,「全国方言資料CD-ROM版」(NHK出版)を対象に,画像データとして収録されている情報のテキスト化に向けた準備を進めた(井上・高丸)。
3つ目の分析対象である位置情報付き大規模WEBデータの収集にあたり,研究分担者として豊橋技科大の吉田助教に新たに加わっていただき,氏が既に構築済みの収集システムおよび既に収集している位置情報付きツイートを分析データとして使用することとした。有機的な研究協力によって,データ収集システムの構築等を新たに行う必要がなくなったため,その分,分析に向けた準備に注力できる結果となった。位置情報付きツイートの一部を利用して,データベース化・可視化の予備実験を行った(吉田・高丸・乙武)。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究課題における平成29年度の研究計画は,①地方議会会議録,②方言談話資料,③位置情報付き大規模WEBデータを対象として,(Ⅰ)データ収集を行った上で,(Ⅱ)分析準備を開始することであった。
①~③のデータ収集を概ね進めることができたため,研究計画(Ⅰ)については順調に進めることができたといえる。また,①地方議会会議録については,話者属性ごとの分析に向けて,情報の付与を適切に進めることができた。②方言談話資料については,小規模データに対する予備的な準備を進めた。画像データとして保有している資料のテキスト化は平成30年度に進める必要がある。③位置情報付き大規模WEBデータについては,データの収集は順調に行われた。また,データベース化,可視化についての予備実験を29年度中に実施することができた。また,先行研究に関する調査にも成果があった。このことから,全体としておおむね順調+α程度の進捗状況と考える。

今後の研究の推進方策

平成30年度以降も,原則的には当初の研究計画に従って,研究を進めていく。データの準備作業を進め,収集データをデータベースマネジメントシステムに登録し,ウェブベースでの横断検索,KWIC表示,クロス集計,出現頻度の可視化(地図化)を行える仕組みを整える。これまでに構築した地方議会会議録コーパスを対象とした同様のシステムを部分的に変更し、データおよびその出典、都道府県名、細かい地域名、(情報が分かる場合には)話者属性を登録できるようにする。その後,方言語彙分布の可視化,単語出現頻度の統計分析,テキストマイニング手法による言語特徴の洗い出しなどの分析を進めて行く予定である。

次年度使用額が生じた理由

研究計画では,方言談話資料のデータ準備(テキスト化)など,平成29年度から30年度にまたがって実施している研究が複数存在する。これにかかる人件費や打ち合わせのための旅費等が会計年度の区分の上で平成29年度内に支出されなかったため,次年度への繰越が生じた。
研究計画どおりの支出を行った上で,会計区分上の繰越額が生じているだけなので,平成30年度以降も研究計画通りに研究を進める。

  • 研究成果

    (6件)

すべて 2017

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (5件) (うち国際学会 1件)

  • [雑誌論文] A Web-Based Visualization System for Interdisciplinary Research Using Japanese Local Political Corpus2017

    • 著者名/発表者名
      Hokuto Ototake, Hiroki Sakaji, Keiichi Takamaru, Akio Kobayashi, Yuzu Uchida, Yasutomo Kimura
    • 雑誌名

      Lecture Notes on Data Engineering and Communications Technologies

      巻: - ページ: 1076-1085

    • DOI

      https://doi.org/10.1007/978-3-319-65521-5_99

    • 査読あり
  • [学会発表] Demonstration of the Online Local Assembly Minutes2017

    • 著者名/発表者名
      Keiichi Takamaru
    • 学会等名
      Workshop 5: Hansards as a dialectal resource, the Sixteenth International Conference on Methods in Dialectology (METHODS XVI)
    • 国際学会
  • [学会発表] 全地方議会会議録の横断検索に向けたデータ収集とデータ構造の検討2017

    • 著者名/発表者名
      井原 大将, 内田 ゆず, 高丸 圭一, 木村 泰知, 江崎 浩
    • 学会等名
      情報処理学会第233回自然言語処理研究会
  • [学会発表] 都道府県議会会議録のパネルデータ作成に向けた発言者情報の付与2017

    • 著者名/発表者名
      木村泰知, 内田ゆず, 高丸圭一
    • 学会等名
      第33回ファジィシステムシンポジウム講演論文集
  • [学会発表] 都道府県議会会議録を対象とした議題・議案表現の自動抽出に向けた検討2017

    • 著者名/発表者名
      田中琢真,小林暁雄,坂地泰紀,内田ゆず,乙武北斗,高丸圭一,木村泰知,増山繁
    • 学会等名
      第31回人工知能学会全国大会
  • [学会発表] 議論の背景・過程・結果を関連づける地方政治コーパスの構築の試み2017

    • 著者名/発表者名
      木村泰知,小林暁雄,坂地泰紀,内田ゆず,高丸圭一,乙武北斗,吉田光男,荒木健治
    • 学会等名
      第31回人工知能学会全国大会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi