• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

日本語歴史コーパスの多層的拡張による精密化とその活用

Research Project

Project/Area Number 15H01883
Research InstitutionNational Institute for Japanese Language and Linguistics

Principal Investigator

小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 准教授 (20337489)

Co-Investigator(Kenkyū-buntansha) 松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
村上 謙  関西学院大学, 文学部, 教授 (20431728)
冨士池 優美  中央大学, 文学部, 准教授 (20510572)
鴻野 知暁  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, プロジェクトPDフェロー (30751515)
岡島 昭浩  大阪大学, 文学研究科, 教授 (50194345)
田中 牧郎  明治大学, 国際日本学部, 専任教授 (90217076)
高田 智和  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 准教授 (90415612)
市村 太郎  常葉大学, 教育学部, 講師 (10701352)
Project Period (FY) 2015-04-01 – 2019-03-31
Keywords日本語史 / コーパス / アノテーション / 形態素解析 / 万葉集 / 近代語 / 日本語歴史コーパス / 自然言語処理
Outline of Annual Research Achievements

上代・和歌・近世・近代の4つのグループに分かれて、『日本語歴史コーパス』の多層的な情報付与に関する研究を行った。
上代グループでは、昨年度までに開発した『万葉集』の読み下し文と原文とのアライメントツールを用いて自動解析を行った後、コーパス構築用のデータベースに格納した。その後人手による修正作業を行い全体の80%程度の作業を完了した。開発した原文アライメントの技術は国語研で開発中のキリシタン資料と洒落本のコーパス化にも活用した。
和歌グループでは、本文整備に先立って、コーパスに付与するメタデータとして歌人情報データベースの作成を行った。
近世グループでは、近松の世話物浄瑠璃のうち、24作品について話者情報や掛詞のマークアップを行ったほか、4作品については形態論情報のアノテーションまで完了した。
近代グループでは、コーパス化の対象とする明治初期口語資料として9作品を選定し、全ての電子テキスト化を完了した。さらにその半分程度についてはXML化と形態論情報の付与を行った。また『安愚楽鍋』のデータ整備を進めたほか、『東洋学芸雑誌』のコーパス化について検討を行った。
以上の『日本語歴史コーパス』拡張作業と並行して、コーパスを活用した各時代の言語の研究等を進め、雑誌論文13本(ブックチャプターを含む)、学会発表10件(うち2件は国際学会)の研究成果を発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

万葉集の読み下し文と原文とのアライメントについては、ツール開発により十分な精度による自動処理が可能になった。自動処理結果を人手修正することで全体の80%程度についてアノテーションを終え、2017年度中に『日本語歴史コーパス』の一部としての公開できる見込みである。
和歌(八代集)テキストのXML化とアノテーションは万葉集の公開後に取り組む予定であるが、本文整備に先立ってコーパスに付与するメタデータとしての歌人データベースの整備を完了するなど順調に進捗している。
近世では、近松浄瑠璃のデータ整備とアノテーションをすすめ、24作品について話者情報や掛詞のマークアップが完了したほか、4作品については形態論情報のアノテーションまで完了した。
近代では、9作品を選定して「明治初期口語啓蒙書コーパス」として整備を進め、全体の半分程度についてXML化と形態論情報の付与を行ったほか、『安愚楽鍋』のデータ整備を進めた。
以上、日本語歴史コーパスの多層的拡張は全体としておおむね順調に進展している。

Strategy for Future Research Activity

「万葉集」「近松」「明治初期口語資料」のコーパス化については予定通りに進捗していることから、引き続き「日本語歴史コーパス」の拡張を行う。2017年度中に「万葉集」を公開した後に「八代集」に取り組むほか、近世の近松作品、近代の明治初期口語啓蒙書、『東洋学芸雑誌』についてコーパス化を進める。
同時に、新たに開発したコーパスを中心に「日本語歴史コーパス」を活用した日本語史研究を継続する。

  • Research Products

    (23 results)

All 2017 2016

All Journal Article (13 results) (of which Acknowledgement Compliant: 4 results,  Peer Reviewed: 2 results) Presentation (10 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] 中古歌合日記の品詞比率2017

    • Author(s)
      冨士池優美
    • Journal Title

      紀要 言語・文学・文化

      Volume: 第119号(通巻第264号) Pages: 57-67

  • [Journal Article] 「ひいやり・ふうわり」型から「ひんやり・ふんわり」型へ2017

    • Author(s)
      岡島昭浩
    • Journal Title

      国語語彙史の研究

      Volume: 36 Pages: 107-117

    • Acknowledgement Compliant
  • [Journal Article] 第8章 日本語史2017

    • Author(s)
      田中牧郎
    • Journal Title

      データで学ぶ日本語学入門(朝倉書店)

      Pages: 84-95

  • [Journal Article] 洒落本コーパス構築の試行2017

    • Author(s)
      市村太郎, 村山実和子
    • Journal Title

      国立国語研究所論集

      Volume: 12 Pages: 29-45

    • DOI

      10.15084/00000852

    • Peer Reviewed
  • [Journal Article] 近世上方における二段活用の一段化とその後の展開2016

    • Author(s)
      村上謙
    • Journal Title

      国語と国文学

      Volume: 93巻5号 Pages: 99-112

    • Acknowledgement Compliant
  • [Journal Article] 近世上方語研究における研究手法について―用例収集と分析・解釈―2016

    • Author(s)
      村上謙
    • Journal Title

      近代語研究

      Volume: 第19集 Pages: 43-60

    • Acknowledgement Compliant
  • [Journal Article] 古代日本語動詞のアスペクト・テンス体系2016

    • Author(s)
      野村剛史
    • Journal Title

      国語国文

      Volume: 85巻11号 Pages: 1-17

    • Peer Reviewed
  • [Journal Article] 近代語のコーパス利用法2016

    • Author(s)
      田中牧郎
    • Journal Title

      青葉ことばの会編『日本語研究法【近代語編】』(おうふう)

      Pages: 184-189

  • [Journal Article] 第6章 形態論と自然言語処理2016

    • Author(s)
      松本裕治
    • Journal Title

      漆原朗子編『形態論』(朝倉日英対照言語学シリーズ)

      Pages: 141-154

  • [Journal Article] 『日本語歴史コーパス』の現状と展望2016

    • Author(s)
      小木曽智信
    • Journal Title

      国語と国文学

      Volume: 93巻5号 Pages: 72-85

    • Acknowledgement Compliant
  • [Journal Article] 【テーマ解説】コーパス2016

    • Author(s)
      小木曽智信
    • Journal Title

      『日本語文法史研究3』 ひつじ書房

      Pages: 255-266

  • [Journal Article] 使用頻度から見た中古仮名文学作品の語彙―コーパスにもとづく分析―2016

    • Author(s)
      小木曽智信
    • Journal Title

      『国語語彙史の研究35』和泉書院

      Pages: 15-37

  • [Journal Article] 洒落本における「いっそ」と「いっこう」2016

    • Author(s)
      市村太郎
    • Journal Title

      近代語研究

      Volume: 第19集 Pages: 21-41

  • [Presentation] 上代・中古における引用句内部の述語活用形をめぐって2017

    • Author(s)
      鴻野知暁
    • Organizer
      「通時コーパス」シンポジウム2017
    • Place of Presentation
      国立国語研究所
    • Year and Date
      2017-03-11
  • [Presentation] 短単位N-gramを利用した万葉集の統計的分析の試み2017

    • Author(s)
      鴻野知暁
    • Organizer
      「通時コーパス」シンポジウム2017
    • Place of Presentation
      国立国語研究所
    • Year and Date
      2017-03-11
  • [Presentation] 江戸・上方洒落本における程度副詞の使用状況2017

    • Author(s)
      市村太郎
    • Organizer
      「通時コーパス」シンポジウム2017
    • Place of Presentation
      国立国語研究所
    • Year and Date
      2017-03-11
  • [Presentation] 書き言葉コーパスに見る助詞の時代差・文体差2017

    • Author(s)
      小木曽智信
    • Organizer
      平成28年度コ―パス合同シンポジウム 「コーパスに見る日本語のバリエーション―助詞のすがた―」
    • Place of Presentation
      国立国語研究所
    • Year and Date
      2017-03-09
  • [Presentation] 明治初期教科書『物理階梯』のコーパス作成による語彙の考察2017

    • Author(s)
      田中牧郎・島田むつみ・髙橋雄太
    • Organizer
      言語資源活用ワークショップ 2016
    • Place of Presentation
      国立国語研究所
    • Year and Date
      2017-03-08
  • [Presentation] 多重の読みを持つテキストのコーパス化2017

    • Author(s)
      小木曽智信
    • Organizer
      言語資源活用ワークショップ2016
    • Place of Presentation
      国立国語研究所
    • Year and Date
      2017-03-07
  • [Presentation] Original-Transcribed Text Alignment for Man'yosyu Written by Old Japanese Language2016

    • Author(s)
      岡照晃,鴻野知暁
    • Organizer
      Language Technology Resources and Tools for Digital Humanities
    • Place of Presentation
      大阪国際会議場
    • Year and Date
      2016-12-11
    • Int'l Joint Research
  • [Presentation] On Japanese Corpora and Tokenization2016

    • Author(s)
      OGISO, Toshinobu
    • Organizer
      Digital Humanities Workshop: The Impact of the Digital on Japanese Studies
    • Place of Presentation
      The Center for East Asian Studies, The University of Chicago
    • Year and Date
      2016-11-12
  • [Presentation] Construction of the Corpus of Historical Japanese2016

    • Author(s)
      Toshinobu OGISO and Yuki WATANABE
    • Organizer
      PNC 2016 Annual Conference and Joint Meetings
    • Place of Presentation
      The Getty Center, Los Angeles
    • Year and Date
      2016-08-18
    • Int'l Joint Research
  • [Presentation] 『日本語歴史コーパス』の拡張とその課題―「通時コーパス」をめざして―2016

    • Author(s)
      小木曽 智信,池上 尚,渡辺 由貴,市村 太郎,近藤 明日子,間淵 洋子
    • Organizer
      日本語学会2016年度春季大会
    • Place of Presentation
      学習院大学
    • Year and Date
      2016-05-16

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi