• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 自己評価報告書

代表性を有する現代日本語書籍コーパスの構築

計画研究

  • PDF
研究領域代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
研究課題/領域番号 18061007
研究種目

特定領域研究

配分区分補助金
審査区分 人文・社会系
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

山崎 誠  独立行政法人国立国語研究所, 研究開発部門, グループ長 (30182489)

研究期間 (年度) 2006 – 2010
キーワード均衡コーパス / 書き言葉 / 代表性 / 書籍 / サンプリング / XML / 形態解析 / 著作権処理
研究概要

本研究では, 現代日本語研究にとってもっとも重要な研究基盤と位置付けられる「書籍コーパス」を構築することを目的とする。このコーパスは, 従来の新聞や文学作品といった単一のジャンルから構成される電子資料と違って, 多様なジャンルや文体を持つ書籍を資料として, その資料的あるいは言語的諸特性を適切に代表するコーパスとして設計する。そのために, ランダムサンプリング, XMLによるタグに記述, 斉一的な言語単位による形態素情報の付与, 著作家処理を行い, 多方面での高度な活用を目指す。

  • 研究成果

    (11件)

すべて 2008 2007 2006

すべて 雑誌論文 (5件) 学会発表 (6件)

  • [雑誌論文] コーパスのための形態論情報2008

    • 著者名/発表者名
      小椋秀樹
    • 雑誌名

      国文学解釈と鑑賞(至文堂) 74-1

      ページ: 26-34

  • [雑誌論文] 国立国語研究所における諸研究-語彙調査の系譜の中心にして-2008

    • 著者名/発表者名
      山崎誠
    • 雑誌名

      国文学解釈と鑑賞(至文堂) 74-1

      ページ: 183-191

  • [雑誌論文] 学術的表現への言い換え-教育現場での選択体系機能言語理論-2007

    • 著者名/発表者名
      佐野大樹
    • 雑誌名

      日本語学 26(13)

      ページ: 60-71

  • [雑誌論文] コーパス言語学の射程2007

    • 著者名/発表者名
      丸山岳彦・田野村忠温
    • 雑誌名

      日本語科学 22

      ページ: 5-12

  • [雑誌論文] 書き言葉コーパスで探る日本語のありさま2006

    • 著者名/発表者名
      柏野和佳子
    • 雑誌名

      日本語学 25-9

      ページ: 18-27

  • [学会発表] Statistical sampling method used in the Balanced Corpus of Contemporary Written Japanese2008

    • 著者名/発表者名
      Maruyama, Takehiko, Makoto Yamazaki, and Kikuo Maekawa
    • 学会等名
      18th International Congress of Linguists
    • 発表場所
      Seoul
    • 年月日
      20080700
  • [学会発表] 形態素解析用辞書UniDicへの語種情報の実装と政府刊行白書の語種比率の分析2008

    • 著者名/発表者名
      小椋秀樹, 小木曽智信, 原裕, 小磯花絵, 冨士池優美
    • 学会等名
      言語処理学会第14回年次大会[NLP2008]予稿集
    • 発表場所
      東京大学
    • 年月日
      20080300
  • [学会発表] 書籍の生産実態を反映するサンプリング-NDCごとに取得したサンプルの多様性の分析-2008

    • 著者名/発表者名
      柏野和佳子・ 丸山岳彦・ 秋元祐哉・ 稲益佐知子・ 佐野大樹・ 田中弥生・ 山崎誠
    • 学会等名
      言語処理学会第14回年次大会[NLP2008]予稿集
    • 発表場所
      東京大学
    • 年月日
      20080300
  • [学会発表] 文字コードとタグによる漢字字体の記述2007

    • 著者名/発表者名
      高田智和・間淵洋子・西部みちる・北村雅則・山口昌也
    • 学会等名
      言語処理学会第13回年次大会[NLP2007]予稿集
    • 発表場所
      龍谷大学
    • 年月日
      20070300
  • [学会発表] 書き言葉の構造を捉える書き言葉の多様な構造とサンプリング手法-2007

    • 著者名/発表者名
      丸山岳彦・柏野和佳子・稲益佐知子・秋元祐哉・吉田谷幸宏・山崎誠
    • 学会等名
      言語処理学会第13回年次大会[NLP2007]予稿集
    • 発表場所
      龍谷大学
    • 年月日
      20070300
  • [学会発表] 現代日本語書き言葉均衡コーパスのサンプリング方法について2006

    • 著者名/発表者名
      山崎誠, 丸山岳彦, 柏野和佳子, 前川喜久雄, 稲益佐知子, 秋元祐哉, 吉田谷幸宏
    • 学会等名
      計量国語学会第50回大会
    • 発表場所
      国立国語研究所
    • 年月日
      2006-09-30

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi