研究課題/領域番号 |
17K02739
|
研究機関 | 宇都宮共和大学 |
研究代表者 |
高丸 圭一 宇都宮共和大学, シティライフ学部, 准教授 (60383121)
|
研究分担者 |
木村 泰知 小樽商科大学, 商学部, 准教授 (50400073)
内田 ゆず 北海学園大学, 工学部, 准教授 (80583575)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
井上 史雄 東京外国語大学, その他部局等, 名誉教授 (40011332)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 地方議会会議録 / 位置情報付きツイート / 方言資料 / 横断検索 |
研究実績の概要 |
平成29年度は,研究計画のうち「(Ⅰ)データ収集」を行った上で,「(Ⅱ)分析準備」を進めた。1つ目の分析対象である議会会議録については,すでにデータ収集済みの47都道府県の地方議会会議録コーパス(平成23年度から27年度まで)における発言者の名寄せ(表記揺れの修正および識別コードの付与)・肩書きの整理を行った。また,議員の属性情報(性別・生年等)を整理した上で,発言データと属性情報の対応関係を明らかにした。この成果については,国際会議等で公表した(高丸・内田・木村)。 2つ目の分析対象である方言談話資料については,電子化されて出版されている全国方言談話データベース「日本のふるさとことば集成」CD-ROM(国立国語研究所編)に収録されているテキストデータを用いて,データベース化・可視化システムの実装に向けた検討を行った(乙武・高丸)。また,「全国方言資料CD-ROM版」(NHK出版)を対象に,画像データとして収録されている情報のテキスト化に向けた準備を進めた(井上・高丸)。 3つ目の分析対象である位置情報付き大規模WEBデータの収集にあたり,研究分担者として豊橋技科大の吉田助教に新たに加わっていただき,氏が既に構築済みの収集システムおよび既に収集している位置情報付きツイートを分析データとして使用することとした。有機的な研究協力によって,データ収集システムの構築等を新たに行う必要がなくなったため,その分,分析に向けた準備に注力できる結果となった。位置情報付きツイートの一部を利用して,データベース化・可視化の予備実験を行った(吉田・高丸・乙武)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題における平成29年度の研究計画は,①地方議会会議録,②方言談話資料,③位置情報付き大規模WEBデータを対象として,(Ⅰ)データ収集を行った上で,(Ⅱ)分析準備を開始することであった。 ①~③のデータ収集を概ね進めることができたため,研究計画(Ⅰ)については順調に進めることができたといえる。また,①地方議会会議録については,話者属性ごとの分析に向けて,情報の付与を適切に進めることができた。②方言談話資料については,小規模データに対する予備的な準備を進めた。画像データとして保有している資料のテキスト化は平成30年度に進める必要がある。③位置情報付き大規模WEBデータについては,データの収集は順調に行われた。また,データベース化,可視化についての予備実験を29年度中に実施することができた。また,先行研究に関する調査にも成果があった。このことから,全体としておおむね順調+α程度の進捗状況と考える。
|
今後の研究の推進方策 |
平成30年度以降も,原則的には当初の研究計画に従って,研究を進めていく。データの準備作業を進め,収集データをデータベースマネジメントシステムに登録し,ウェブベースでの横断検索,KWIC表示,クロス集計,出現頻度の可視化(地図化)を行える仕組みを整える。これまでに構築した地方議会会議録コーパスを対象とした同様のシステムを部分的に変更し、データおよびその出典、都道府県名、細かい地域名、(情報が分かる場合には)話者属性を登録できるようにする。その後,方言語彙分布の可視化,単語出現頻度の統計分析,テキストマイニング手法による言語特徴の洗い出しなどの分析を進めて行く予定である。
|
次年度使用額が生じた理由 |
研究計画では,方言談話資料のデータ準備(テキスト化)など,平成29年度から30年度にまたがって実施している研究が複数存在する。これにかかる人件費や打ち合わせのための旅費等が会計年度の区分の上で平成29年度内に支出されなかったため,次年度への繰越が生じた。 研究計画どおりの支出を行った上で,会計区分上の繰越額が生じているだけなので,平成30年度以降も研究計画通りに研究を進める。
|