• 研究課題をさがす
  • 研究者をさがす
  1. 前のページに戻る

日本語歴史コーパスの多層的拡張による精密化とその活用

研究課題

研究課題/領域番号15H01883
研究種目

基盤研究(A)

配分区分補助金
応募区分一般
研究分野 日本語学
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (20337489)

研究分担者 松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
市村 太郎  常葉大学, 教育学部, 講師 (10701352)
村上 謙  関西学院大学, 文学部, 教授 (20431728)
冨士池 優美  玉川大学, 文学部, 准教授 (20510572)
鴻野 知暁  東京大学, 総合文化研究科, 助教 (30751515)
岡島 昭浩  大阪大学, 文学研究科, 教授 (50194345)
田中 牧郎  明治大学, 国際日本学部, 専任教授 (90217076)
高田 智和  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 准教授 (90415612)
近藤 明日子  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (30425722)
研究期間 (年度) 2015-04-01 – 2019-03-31
研究課題ステータス 交付(2017年度)
配分額 *注記
44,590千円 (直接経費 : 34,300千円、間接経費 : 10,290千円)
2018年度 : 10,140千円 (直接経費 : 7,800千円、間接経費 : 2,340千円)
2017年度 : 10,790千円 (直接経費 : 8,300千円、間接経費 : 2,490千円)
2016年度 : 11,960千円 (直接経費 : 9,200千円、間接経費 : 2,760千円)
2015年度 : 11,700千円 (直接経費 : 9,000千円、間接経費 : 2,700千円)
キーワードコーパス / 日本語史 / 形態素解析 / 近代語 / 万葉集 / アノテーション / 日本語歴史コーパス / 自然言語処理
研究実績の概要

上代・和歌・近世・近代の4つのグループに分かれて、『日本語歴史コーパス』の多層的な情報付与に関する研究を行った。
上代グループでは、昨年度までに開発した『万葉集』の読み下し文と原文とのアライメントツールを用いて自動解析を行った後、コーパス構築用のデータベースに格納した。その後人手による修正作業を行い全体の80%程度の作業を完了した。開発した原文アライメントの技術は国語研で開発中のキリシタン資料と洒落本のコーパス化にも活用した。
和歌グループでは、本文整備に先立って、コーパスに付与するメタデータとして歌人情報データベースの作成を行った。
近世グループでは、近松の世話物浄瑠璃のうち、24作品について話者情報や掛詞のマークアップを行ったほか、4作品については形態論情報のアノテーションまで完了した。
近代グループでは、コーパス化の対象とする明治初期口語資料として9作品を選定し、全ての電子テキスト化を完了した。さらにその半分程度についてはXML化と形態論情報の付与を行った。また『安愚楽鍋』のデータ整備を進めたほか、『東洋学芸雑誌』のコーパス化について検討を行った。
以上の『日本語歴史コーパス』拡張作業と並行して、コーパスを活用した各時代の言語の研究等を進め、雑誌論文13本(ブックチャプターを含む)、学会発表10件(うち2件は国際学会)の研究成果を発表した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2 :  おおむね順調に進展している

理由

万葉集の読み下し文と原文とのアライメントについては、ツール開発により十分な精度による自動処理が可能になった。自動処理結果を人手修正することで全体の80%程度についてアノテーションを終え、2017年度中に『日本語歴史コーパス』の一部としての公開できる見込みである。
和歌(八代集)テキストのXML化とアノテーションは万葉集の公開後に取り組む予定であるが、本文整備に先立ってコーパスに付与するメタデータとしての歌人データベースの整備を完了するなど順調に進捗している。
近世では、近松浄瑠璃のデータ整備とアノテーションをすすめ、24作品について話者情報や掛詞のマークアップが完了したほか、4作品については形態論情報のアノテーションまで完了した。
近代では、9作品を選定して「明治初期口語啓蒙書コーパス」として整備を進め、全体の半分程度についてXML化と形態論情報の付与を行ったほか、『安愚楽鍋』のデータ整備を進めた。
以上、日本語歴史コーパスの多層的拡張は全体としておおむね順調に進展している。

今後の研究の推進方策

「万葉集」「近松」「明治初期口語資料」のコーパス化については予定通りに進捗していることから、引き続き「日本語歴史コーパス」の拡張を行う。2017年度中に「万葉集」を公開した後に「八代集」に取り組むほか、近世の近松作品、近代の明治初期口語啓蒙書、『東洋学芸雑誌』についてコーパス化を進める。
同時に、新たに開発したコーパスを中心に「日本語歴史コーパス」を活用した日本語史研究を継続する。

報告書

(2件)
  • 2016 実績報告書
  • 2015 実績報告書

研究成果

(42件)

すべて 2017 2016 2015

すべて 雑誌論文 学会発表

  • [雑誌論文] 中古歌合日記の品詞比率2017

    • 著者名/発表者名
      冨士池優美
    • 雑誌名

      紀要 言語・文学・文化

      巻 : 第119号(通巻第264号) ページ : 57-67

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] 「ひいやり・ふうわり」型から「ひんやり・ふんわり」型へ2017

    • 著者名/発表者名
      岡島昭浩
    • 雑誌名

      国語語彙史の研究

      巻 : 36 ページ : 107-117

    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [雑誌論文] 第8章 日本語史2017

    • 著者名/発表者名
      田中牧郎
    • 雑誌名

      データで学ぶ日本語学入門(朝倉書店)

      ページ : 84-95

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] 洒落本コーパス構築の試行2017

    • 著者名/発表者名
      市村太郎, 村山実和子
    • 雑誌名

      国立国語研究所論集

      巻 : 12 ページ : 29-45

    • 関連する報告書
      2016 実績報告書
    • 査読あり / オープンアクセスとしている / 謝辞記載あり
  • [雑誌論文] 近世上方における二段活用の一段化とその後の展開2016

    • 著者名/発表者名
      村上謙
    • 雑誌名

      国語と国文学

      巻 : 93巻5号 ページ : 99-112

    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [雑誌論文] 近世上方語研究における研究手法について―用例収集と分析・解釈―2016

    • 著者名/発表者名
      村上謙
    • 雑誌名

      近代語研究

      巻 : 第19集 ページ : 43-60

    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [雑誌論文] 古代日本語動詞のアスペクト・テンス体系2016

    • 著者名/発表者名
      野村剛史
    • 雑誌名

      国語国文

      巻 : 85巻11号 ページ : 1-17

    • 関連する報告書
      2016 実績報告書
    • 査読あり
  • [雑誌論文] 近代語のコーパス利用法2016

    • 著者名/発表者名
      田中牧郎
    • 雑誌名

      青葉ことばの会編『日本語研究法【近代語編】』(おうふう)

      ページ : 184-189

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] 第6章 形態論と自然言語処理2016

    • 著者名/発表者名
      松本裕治
    • 雑誌名

      漆原朗子編『形態論』(朝倉日英対照言語学シリーズ)

      ページ : 141-154

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] 『日本語歴史コーパス』の現状と展望2016

    • 著者名/発表者名
      小木曽智信
    • 雑誌名

      国語と国文学

      巻 : 93巻5号 ページ : 72-85

    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [雑誌論文] 【テーマ解説】コーパス2016

    • 著者名/発表者名
      小木曽智信
    • 雑誌名

      『日本語文法史研究3』 ひつじ書房

      ページ : 255-266

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] 使用頻度から見た中古仮名文学作品の語彙―コーパスにもとづく分析―2016

    • 著者名/発表者名
      小木曽智信
    • 雑誌名

      『国語語彙史の研究35』和泉書院

      ページ : 15-37

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] 洒落本における「いっそ」と「いっこう」2016

    • 著者名/発表者名
      市村太郎
    • 雑誌名

      近代語研究

      巻 : 第19集 ページ : 21-41

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] 演説の文末表現の変遷―明治時代から昭和10年代まで2016

    • 著者名/発表者名
      田中牧郎
    • 雑誌名

      相澤正夫・金澤裕之編『SP盤演説レコードがひらく日本語研究』

      ページ : 248-270

    • 関連する報告書
      2015 実績報告書
  • [雑誌論文] 大正~昭和前期における助動詞マスの終止・連体形について―マスルの使用状況を中心に2016

    • 著者名/発表者名
      岡部嘉幸
    • 雑誌名

      相澤正夫・金澤裕之編『SP盤演説レコードがひらく日本語研究』

      ページ : 131-154

    • 関連する報告書
      2015 実績報告書
  • [雑誌論文] 中古和文における文体別の特徴語2015

    • 著者名/発表者名
      小木曽智信
    • 雑誌名

      ひつじ書房『コーパスと日本語史研究』

      ページ : 93-117

    • 関連する報告書
      2015 実績報告書
  • [雑誌論文] 『日本語歴史コーパス』による平安時代と室町時代の語彙の比較2015

    • 著者名/発表者名
      田中牧郎
    • 雑誌名

      国語研プロジェクトレビュー

      巻 : 6(1) ページ : 11-20

    • 関連する報告書
      2015 実績報告書
  • [学会発表] 上代・中古における引用句内部の述語活用形をめぐって2017

    • 著者名/発表者名
      鴻野知暁
    • 学会等名
      「通時コーパス」シンポジウム2017
    • 発表場所
      国立国語研究所
    • 年月日
      2017-03-11
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 短単位N-gramを利用した万葉集の統計的分析の試み2017

    • 著者名/発表者名
      鴻野知暁
    • 学会等名
      「通時コーパス」シンポジウム2017
    • 発表場所
      国立国語研究所
    • 年月日
      2017-03-11
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 江戸・上方洒落本における程度副詞の使用状況2017

    • 著者名/発表者名
      市村太郎
    • 学会等名
      「通時コーパス」シンポジウム2017
    • 発表場所
      国立国語研究所
    • 年月日
      2017-03-11
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 書き言葉コーパスに見る助詞の時代差・文体差2017

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      平成28年度コ―パス合同シンポジウム 「コーパスに見る日本語のバリエーション―助詞のすがた―」
    • 発表場所
      国立国語研究所
    • 年月日
      2017-03-09
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 明治初期教科書『物理階梯』のコーパス作成による語彙の考察2017

    • 著者名/発表者名
      田中牧郎・島田むつみ・髙橋雄太
    • 学会等名
      言語資源活用ワークショップ 2016
    • 発表場所
      国立国語研究所
    • 年月日
      2017-03-08
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 多重の読みを持つテキストのコーパス化2017

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      言語資源活用ワークショップ2016
    • 発表場所
      国立国語研究所
    • 年月日
      2017-03-07
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Original-Transcribed Text Alignment for Man'yosyu Written by Old Japanese Language2016

    • 著者名/発表者名
      岡照晃,鴻野知暁
    • 学会等名
      Language Technology Resources and Tools for Digital Humanities
    • 発表場所
      大阪国際会議場
    • 年月日
      2016-12-11
    • 関連する報告書
      2016 実績報告書
    • 国際共著/国際学会である
  • [学会発表] On Japanese Corpora and Tokenization2016

    • 著者名/発表者名
      OGISO, Toshinobu
    • 学会等名
      Digital Humanities Workshop: The Impact of the Digital on Japanese Studies
    • 発表場所
      The Center for East Asian Studies, The University of Chicago
    • 年月日
      2016-11-12
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Construction of the Corpus of Historical Japanese2016

    • 著者名/発表者名
      Toshinobu OGISO and Yuki WATANABE
    • 学会等名
      PNC 2016 Annual Conference and Joint Meetings
    • 発表場所
      The Getty Center, Los Angeles
    • 年月日
      2016-08-18
    • 関連する報告書
      2016 実績報告書
    • 国際共著/国際学会である
  • [学会発表] 『日本語歴史コーパス』の拡張とその課題―「通時コーパス」をめざして―2016

    • 著者名/発表者名
      小木曽 智信,池上 尚,渡辺 由貴,市村 太郎,近藤 明日子,間淵 洋子
    • 学会等名
      日本語学会2016年度春季大会
    • 発表場所
      学習院大学
    • 年月日
      2016-05-16
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 文書構造を利用した近世期洒落本の形態素解析2016

    • 著者名/発表者名
      市村太郎, 小木曽智信
    • 学会等名
      言語処理学会第22回年次大会
    • 発表場所
      東北大学
    • 年月日
      2016-03-08
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 歴史的資料を対象とした複数のUniDicによる形態素解析支援ツール『Web茶まめ』2015

    • 著者名/発表者名
      堤 智昭, 小木曽 智信
    • 学会等名
      人文科学とコンピュータシンポジウム 「じんもんこん2015」
    • 発表場所
      同志社大学京田辺校地
    • 年月日
      2015-12-19
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 異なる文体の混在するテキストに対する複数辞書切り替えによる解析手法の提案2015

    • 著者名/発表者名
      間淵 洋子, 小木曽智信
    • 学会等名
      人文科学とコンピュータシンポジウム 「じんもんこん2015」
    • 発表場所
      同志社大学京田辺校地
    • 年月日
      2015-12-19
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 人情本のコーパス化2015

    • 著者名/発表者名
      藤本灯、北﨑勇帆、市村太郎、岡部嘉幸、高田智和
    • 学会等名
      日本語学会2015年度秋季大会
    • 発表場所
      山口大学
    • 年月日
      2015-10-31
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 近代雑誌コーパスを利用した文語複合辞の抽出試行2015

    • 著者名/発表者名
      近藤明日子
    • 学会等名
      通時コーパス国際シンポジウム
    • 発表場所
      国立国語研究所
    • 年月日
      2015-10-04
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 日本語歴史コーパスの量的・質的拡張2015

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      「通時コーパス」国際シンポジウム
    • 発表場所
      国立国語研究所
    • 年月日
      2015-10-04
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 万葉集コーパスの設計2015

    • 著者名/発表者名
      鴻野知暁
    • 学会等名
      「通時コーパス」国際シンポジウム
    • 発表場所
      国立国語研究所
    • 年月日
      2015-10-04
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 『日本語歴史コーパス』による時代間の語彙比較2015

    • 著者名/発表者名
      田中牧郎
    • 学会等名
      「通時コーパス」国際シンポジウム
    • 発表場所
      国立国語研究所
    • 年月日
      2015-10-04
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 『日本語歴史コーパス 江戸時代編』の現状と今後2015

    • 著者名/発表者名
      市村 太郎,上野 左絵
    • 学会等名
      「通時コーパス」国際シンポジウム
    • 発表場所
      国立国語研究所
    • 年月日
      2015-10-04
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 『日本語歴史コーパス』にもとづく中古仮名文学作品の語彙分析2015

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      第110回国語語彙史研究会
    • 発表場所
      京都大学
    • 年月日
      2015-09-26
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 「正しい日本語」ってなに? ―コーパスに見る日本語のバリエーション― 歴史コーパスの観点から2015

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      国立国語研究所 コーパス合同シンポジウム
    • 発表場所
      国立国語研究所
    • 年月日
      2015-09-03
    • 関連する報告書
      2015 実績報告書
  • [学会発表] 山田 祐実、大村 舞、鴻野 知暁、Kevin Duh、小木曽 智信、松本 裕治2015

    • 著者名/発表者名
      万葉集を対象とした原文と読み下し文のアライメント
    • 学会等名
      第8回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      2015-09-02
    • 関連する報告書
      2015 実績報告書
  • [学会発表] Construction of the Corpus of Toraakira-bon Kyogen2015

    • 著者名/発表者名
      Taro ICHIMURA, Yuki WATANABE, Tomoaki KOUNO, Toshinobu OGISO
    • 学会等名
      DH2015: Annual Conference of Digital Humanities
    • 発表場所
      University of Western Sydney, Australia
    • 年月日
      2015-07-01
    • 関連する報告書
      2015 実績報告書
    • 国際共著/国際学会である
  • [学会発表] Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information2015

    • 著者名/発表者名
      Tomoaki Kouno, Toshinobu Ogiso
    • 学会等名
      The 9th International Conference of ASIALEX (ASIALEX2015)
    • 発表場所
      The Hong Kong Polytechnic University
    • 年月日
      2015-06-26
    • 関連する報告書
      2015 実績報告書
    • 国際共著/国際学会である
  • [学会発表] 現代語からみた江戸語文法2015

    • 著者名/発表者名
      岡部嘉幸
    • 学会等名
      東京大学国語国文学会公開シンポジウム
    • 発表場所
      東京大学
    • 年月日
      2015-04-18
    • 関連する報告書
      2015 実績報告書

URL :

公開日 : 2015-04-16   更新日 : 2018-04-23  

サービス概要 よくある質問 お知らせ 利用規程

Powered by NII kakenhi