研究課題/領域番号 |
26370498
|
研究機関 | 宇都宮共和大学 |
研究代表者 |
高丸 圭一 宇都宮共和大学, 公私立大学の部局等, 准教授 (60383121)
|
研究分担者 |
木村 泰知 小樽商科大学, 商学部, 准教授 (50400073)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
井上 史雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 教授 (40011332)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 地方議会会議録 / 気づかない方言 / テキストマイニング / オノマトペ |
研究実績の概要 |
本研究課題を開始するにあたり,まず乙武が中心となって,木村科研(No.22300086)で自動収集プログラムおよび自動整形プログラムによって作成した地方議会会議録データの整理を行った。今後の研究を円滑に進めるために,収集した会議録の全文検索システムを構築した。システムに収められた425自治体の会議録(総文数は約1億3397万)を対象に気づかない方言の分析を行うこととした。また,井上・高丸・乙武により,気づかない方言の分析を円滑に進める手法を検討し,GISを用いて検索結果の可視化システムを作成した。構築したシステムの概要はウェブサイトにて公開した。 テキストマイニング分析を実施するために,都道府県,県庁所在地市,政令指定都市,東京特別区を対象として,直近4年分の会議録を追加収集した(高丸・木村),平成26年度には,このデータを対象としてTF・IDF法を利用した議員発言特徴語抽出の予備的検討を実施し,結果の一部をウェブサイトにて公開した。 議会発言に出現するオノマトペ(擬音語・擬態語)を対象として,出現頻度,係り先などの地域差についての分析を進めた(高丸,木村)。オノマトペは短い文字列であり,書きことばにおいても特殊拍の多様な挿入が見られるため,自動抽出が容易ではない。このため,平成26年度には,オノマトペ抽出手法についても検討を行った。地方議会会議録に見られるオノマトペの出現実態,および,オノマトペ抽出における問題点について,人工知能学会論文誌(査読有)に論文としてまとめた。また,オノマトペ抽出手法の検討(ファジーシステムシンポジウム),および,多変量解析を用いたオノマトペ使用の地域差(コーパス日本語学ワークショップ)について,それぞれ研究成果を発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画書において平成26年度内に実施予定であった「研究計画(1)データ検証,追加収集」は期間内に適切に行うことができた。以降の研究を行うためのデータの準備や検索システム等の道具立ても適切に整い計画は順調に進んだと考える。また,平成26~27年度に実施予定である「研究計画(2)既知の方言の検証」については,GISを使った方言語彙分布の可視化が順調に進みつつある。また,オノマトペを対象とした分析については,学会発表3件,査読付論文1件の研究成果があり,非常に順調に進んだ。同じく平成26~27年度に実施予定である「研究計画(3)自治体ごとのテキストマイニング分析」についても,追加収集した会議録を対象として,TF・IDFを用いた議員特徴語の予備分析を26年度内に進め,結果の一部をウェブサイトにて公開することができた。これについても,ほぼ順調な進捗であると考えられる。
|
今後の研究の推進方策 |
研究は概ね計画通りに進捗している。平成27年度以降も「研究計画(2)既知の方言の検証」および「研究計画(3)自治体ごとのテキストマイニング分析」について,研究計画に従って適切に研究を進める予定である。平成26年度に実施したオノマトペの分析において,この分野についての研究業績を有する北海学園大学内田ゆず准教授に助言をいただいた。さらに分析を円滑に進めるために平成27年度からは研究体制を見直し,内田准教授に研究分担者として加わってもらうこととした。
|