• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Self-evaluation Report

Compilation of a balanced book corpus of contemporary written Japanese

Planned Research

  • PDF
Project AreaCompilation of a balanced corpus of written Japanese: Infrastructure for the coming Japanese linguistics
Project/Area Number 18061007
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Humanities and Social Sciences
Research InstitutionThe National Institute for Japanese Language

Principal Investigator

YAMAZAKI Makoto  The National Institute for Japanese Language, 研究開発部門, グループ長 (30182489)

Project Period (FY) 2006 – 2010
Keywords均衡コーパス / 書き言葉 / 代表性 / 書籍 / サンプリング / XML / 形態解析 / 著作権処理
Research Abstract

本研究では, 現代日本語研究にとってもっとも重要な研究基盤と位置付けられる「書籍コーパス」を構築することを目的とする。このコーパスは, 従来の新聞や文学作品といった単一のジャンルから構成される電子資料と違って, 多様なジャンルや文体を持つ書籍を資料として, その資料的あるいは言語的諸特性を適切に代表するコーパスとして設計する。そのために, ランダムサンプリング, XMLによるタグに記述, 斉一的な言語単位による形態素情報の付与, 著作家処理を行い, 多方面での高度な活用を目指す。

  • Research Products

    (11 results)

All 2008 2007 2006

All Journal Article (5 results) Presentation (6 results)

  • [Journal Article] コーパスのための形態論情報2008

    • Author(s)
      小椋秀樹
    • Journal Title

      国文学解釈と鑑賞(至文堂) 74-1

      Pages: 26-34

  • [Journal Article] 国立国語研究所における諸研究-語彙調査の系譜の中心にして-2008

    • Author(s)
      山崎誠
    • Journal Title

      国文学解釈と鑑賞(至文堂) 74-1

      Pages: 183-191

  • [Journal Article] 学術的表現への言い換え-教育現場での選択体系機能言語理論-2007

    • Author(s)
      佐野大樹
    • Journal Title

      日本語学 26(13)

      Pages: 60-71

  • [Journal Article] コーパス言語学の射程2007

    • Author(s)
      丸山岳彦・田野村忠温
    • Journal Title

      日本語科学 22

      Pages: 5-12

  • [Journal Article] 書き言葉コーパスで探る日本語のありさま2006

    • Author(s)
      柏野和佳子
    • Journal Title

      日本語学 25-9

      Pages: 18-27

  • [Presentation] Statistical sampling method used in the Balanced Corpus of Contemporary Written Japanese2008

    • Author(s)
      Maruyama, Takehiko, Makoto Yamazaki, and Kikuo Maekawa
    • Organizer
      18th International Congress of Linguists
    • Place of Presentation
      Seoul
    • Year and Date
      20080700
  • [Presentation] 形態素解析用辞書UniDicへの語種情報の実装と政府刊行白書の語種比率の分析2008

    • Author(s)
      小椋秀樹, 小木曽智信, 原裕, 小磯花絵, 冨士池優美
    • Organizer
      言語処理学会第14回年次大会[NLP2008]予稿集
    • Place of Presentation
      東京大学
    • Year and Date
      20080300
  • [Presentation] 書籍の生産実態を反映するサンプリング-NDCごとに取得したサンプルの多様性の分析-2008

    • Author(s)
      柏野和佳子・ 丸山岳彦・ 秋元祐哉・ 稲益佐知子・ 佐野大樹・ 田中弥生・ 山崎誠
    • Organizer
      言語処理学会第14回年次大会[NLP2008]予稿集
    • Place of Presentation
      東京大学
    • Year and Date
      20080300
  • [Presentation] 文字コードとタグによる漢字字体の記述2007

    • Author(s)
      高田智和・間淵洋子・西部みちる・北村雅則・山口昌也
    • Organizer
      言語処理学会第13回年次大会[NLP2007]予稿集
    • Place of Presentation
      龍谷大学
    • Year and Date
      20070300
  • [Presentation] 書き言葉の構造を捉える書き言葉の多様な構造とサンプリング手法-2007

    • Author(s)
      丸山岳彦・柏野和佳子・稲益佐知子・秋元祐哉・吉田谷幸宏・山崎誠
    • Organizer
      言語処理学会第13回年次大会[NLP2007]予稿集
    • Place of Presentation
      龍谷大学
    • Year and Date
      20070300
  • [Presentation] 現代日本語書き言葉均衡コーパスのサンプリング方法について2006

    • Author(s)
      山崎誠, 丸山岳彦, 柏野和佳子, 前川喜久雄, 稲益佐知子, 秋元祐哉, 吉田谷幸宏
    • Organizer
      計量国語学会第50回大会
    • Place of Presentation
      国立国語研究所
    • Year and Date
      2006-09-30

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi