研究課題/領域番号 |
22300086
|
研究機関 | 小樽商科大学 |
研究代表者 |
木村 泰知 小樽商科大学, 商学部, 准教授 (50400073)
|
研究分担者 |
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
河村 和徳 東北大学, 情報科学研究科, 准教授 (60306868)
高丸 圭一 宇都宮共和大学, 公私立大学の部局等, 講師 (60383121)
森 辰則 横浜国立大学, 環境情報研究科(研究院), 教授 (70212264)
湯淺 墾道 情報セキュリティ大学院大学, その他の研究科, 教授 (60389400)
|
研究期間 (年度) |
2010-04-01 – 2014-03-31
|
キーワード | 地方議会会議録 / コーパス構築 / 自然言語処理 / 地方政治 / 情報抽出 / 整文 |
研究概要 |
本研究では,地方政治に関する研究の活性化・学際的応用を目指して,研究者が利用可能な地方政治電子化コーパスを全国規模で構築しウェブ上で提供する.また,そのコーパスを利用した政治学,社会情報学,情報工学の研究を行い,その成果を学際的に応用した政治情報システムの開発を行う. 本年度は,電子化コーパスの構築を継続するとともに,複数の研究分野において学際的応用研究に向けた研究を行った. 電子化コーパスの構築では,前年度に引き続き,ウェブ上に公開されている会議録の収集とデータ整備を実施した.平成24年度は,収集した会議録データへ容易にアクセスするために,地方議会会議録の情報検索システムを構築するとともに,会議録に含まれる発言を単語単位に分割し,単語の並びの頻度を求めたn-gram(最大7-gram)データの構築を行った. 学際的応用研究に向けた研究では,情報工学の観点から,地域政治情報コーパスへの賛否の積極性に関する注釈付けを行った.また,言語学の観点から,地方議会会議録の言語資源としての性質を明らかにするための基礎研究として,形態素N-gramを用いた文末表現に着目した地域変異検出を試みた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成24年度は,研究計画通り,学際的応用としての政治情報システムの開発に重点をおき,情報工学以外の分野でも利用可能な地方議会コーパスとして,会議録に含まれる発言を形態素単位に分割し,形態素の並びの頻度を求めた形態素n-gram(最大7-gram)を提供した.社会言語学の分野では,地方議会会議録の形態素n-gramを用いて,地域特有の文末表現を検出に関する研究が行われている.
|
今後の研究の推進方策 |
今後の研究では,今までに収集した会議録コーパスを,政治学,社会言語学,情報工学の各分野において,利用してもらう予定である. そのためには,コーパスを公開する必要があり,著作権の問題を解決する必要があり,共同研究者の法学者と対応策を考えている.
|