• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Annual Research Report

日本語諸方言コーパスの構築とコーパスを使った方言研究の開拓

Research Project

Project/Area Number 16H01933
Research InstitutionNational Institute for Japanese Language and Linguistics

Principal Investigator

木部 暢子  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 教授 (30192016)

Co-Investigator(Kenkyū-buntansha) 井上 文子  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 准教授 (90263186)
三井 はるみ  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 助教 (50219672)
新田 哲夫  金沢大学, 歴史言語文化学系, 教授 (90172725)
日高 水穂  関西大学, 文学部, 教授 (80292358)
五十嵐 陽介  一橋大学, 大学院社会学研究科, 准教授 (00549008)
田附 敏尚  神戸松蔭女子学院大学, 文学部, 講師 (90645813)
椎名 渉子  フェリス女学院大学, 留学生センタ-, 講師 (70765685)
熊谷 康雄  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 准教授 (30215016)
Project Period (FY) 2016-04-01 – 2021-03-31
Keywords方言コーパス / 諸方言の横断検索 / 方言談話資料 / 対格標示形式の地域差 / 疑問文の文末音調の地域差 / 日本のふるさとことば集成 / 各地方言収集緊急調査
Outline of Annual Research Achievements

本研究の目的は、諸方言を横断的に検索する「日本語諸方言コーパス」を構築・公開すること、コーパスを使って言語分析を行い、新しい方言研究の方法を提示すること、方言データを整備することにより、各地の消滅危機言語・方言の記録・保存・公開を行うことである。29年度は5年計画の2年目にあたる。実施内容は以下のとおりである。
コーパス構築のためのデータは、文化庁の「各地方言収集緊急調査」(1977~1985 年調査)の談話資料を使用している。今年度はこのうち、『日本のふるさとことば集成』(国書刊行会)所収の24時間分のデータにつき、談話音声・方言テキスト・標準語テキストの3者のアラインメント作業、及び検索のためのタグ付け作業を完了した。また、文化庁の「各地方言収集緊急調査」データのうち、『日本のふるさとことば集成』未収録データの整備を開始し、24時間分の音声データに対して方言テキストと標準語訳テキストのネイティブ・チェックを行なった。これらの作業を共同で行うためには、各地点のデータ整備の方法を共有化しておく必要がある。そのために研究打合せを2回開催し、方言テキスト、標準語テキストの表記方法、タグ付け等の整備方式を確定した。これを受けて、『方言コーパス構築のための作業マニュアル』を作成した。
整備したデータをもとに方言を分析し、以下の発表を行なった。①一人称代名詞の男女差に関する考察、②疑問文の文末音調に上昇調タイプ、下降調タイプ、疑問形式の有無に依存するタイプといった地域差があること、③対格標示形式(「を」など)の地域差、④富山方言における「と抜け」(引用標識の「と」を使用しないこと)の特徴。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

文化庁の「各地方言収集緊急調査」のうちの『日本のふるさとことば集成』(国書刊行会)所収の24時間分のデータにつき、談話音声・方言テキスト・標準語テキストの3者のアラインメント作業、及び検索のためのタグ付け作業を終えた。また、これらのデータに関して試験的に検索システムを導入した。
文化庁「各地方言収集緊急調査」の未公開データ(『日本のふるさとことば集成』未収録データ)のうち、24時間分のデータ(24地点×1時間)に対して、方言テキストと標準語テキストのネイティブ・チェックを行い、次年度以降、音声とテキストの紐付け作業とタグ付け作業を行う準備を整えた。
上記の作業のための『方言コーパス構築のための作業マニュアル』を作成した。マニュアルの作成にあたっては、国立国語研究所のコーパス開発センターや先行のコーパスプロジェクト、情報学の研究者から助言を受けるとともに、研究打合せを2回開催して、順次、内容を更新した。マニュアルは来年度公開する予定である。
コーパスを使った方言分析を行い、国際学会、国内学会等で発表した。今年度までは本コーパスを非公開としているため、すべて科研担当者による発表である。次年度以降はコーパス・モニター版を公開し、活用を促進する予定である。

Strategy for Future Research Activity

今後は、整備を終えた『日本のふるさとことば集成』収録の47地点、24時間分のデータに対して中納言による検索機能を付加し、30年度に『日本語諸方言コーパス モニター版』を公開する。それにより、コーパスを活用した方言研究を学界等において広く推進する予定である。同時に、方言コーパスを利用する際の注意点等についても検討し、公開する予定である。
コーパスのデータ量を増やすために、文化庁の「各地方言収集緊急調査」の未公開データの整備を引き続き行う。最終年度までにデータ量を75時間分に増やす予定である。
作業を効率的に行うために、作業の自動化を進める。29年度は音声と方言テキストのアラインメント作業の一部について自動化を行った。今後は、さらに自動化できる部分はどこかの検討に入り、自動化を推進する。なお、作業の自動化にあたっては、先行する諸コーパス(BCCWJ, CSJ, CJH)の担当者や情報学の研究者の助言を受け、方言辞書の作成も視野に入れた検討を行う。それに伴い、作業マニュアルを順次更新し、充実させた上で公開する。

  • Research Products

    (16 results)

All 2018 2017

All Journal Article (3 results) (of which Peer Reviewed: 2 results) Presentation (10 results) (of which Int'l Joint Research: 4 results,  Invited: 3 results) Book (3 results)

  • [Journal Article] 「富山の方言-砺波市方言の引用標識をめぐって-」2018

    • Author(s)
      木部暢子
    • Journal Title

      『砺波散村地域研究所研究紀要』

      Volume: 35 Pages: 1-11

  • [Journal Article] 「『日本言語地図』と『日本言語地図』データベース:データベース化(LAJDB)による多角的分析に向けて」2017

    • Author(s)
      熊谷康雄
    • Journal Title

      『方言の研究』

      Volume: 3 Pages: 29-51

    • Peer Reviewed
  • [Journal Article] 「首都圏若年層の言語に地域差をもたらすもの」2017

    • Author(s)
      三井はるみ,鑓水兼貴
    • Journal Title

      『方言の研究』

      Volume: 3 Pages: 103-127

    • Peer Reviewed
  • [Presentation] 「言語調査における連携・協力~八丈島・岡崎市・鶴岡市などの調査から」2018

    • Author(s)
      木部暢子
    • Organizer
      第32回人文機構シンポジウム/情報・システム研究機構シンポジウム
    • Invited
  • [Presentation] 「日本語諸方言コーパスに見る富山方言」2017

    • Author(s)
      木部暢子
    • Organizer
      富山大学人文学部 第6回言語学・日本語学公開講演会
    • Invited
  • [Presentation] 「ことばが接するところ -富山の方言-」2017

    • Author(s)
      木部暢子
    • Organizer
      砺波散村地域研究所例会
    • Invited
  • [Presentation] “Copus based study of Japanese dialects: Regional differences in case marking system”2017

    • Author(s)
      Nobuko Kibe, Kumiko Sato, Taro Nakanishi and Kohei Nakazawa
    • Organizer
      Methods in Dialectology XVI
    • Int'l Joint Research
  • [Presentation] “A quantitative observation of the relation among population distributions, road networks, and dialect similiarities”2017

    • Author(s)
      Yasuo Kumagai
    • Organizer
      Methods in Dialectology XVI
    • Int'l Joint Research
  • [Presentation] “The structure of diversified language usage in metropolitan Tokyo”2017

    • Author(s)
      MITSUI Harumi, YARIMIZU Kanetaka, SAWAKI Motoei
    • Organizer
      Methods in Dialectology XVI
    • Int'l Joint Research
  • [Presentation] “Plural Forms in Yoron-Ryukyuan”2017

    • Author(s)
      Kibe, Nobuko and Oshima, Hajime
    • Organizer
      The 25th Japanese/Korean Linguistics Conference
    • Int'l Joint Research
  • [Presentation] 「統語的曖昧性を解消する韻律的手段:東京方言と近畿方言」2017

    • Author(s)
      五十嵐陽介,広瀬友紀
    • Organizer
      第31回日本音声学会全国大会
  • [Presentation] 「諸方言の文末イントネーション-日本語諸方言コーパスから-」2017

    • Author(s)
      木部暢子・大槻知世・佐藤久美子
    • Organizer
      音声資源活用シンポジウム
  • [Presentation] 「諸方言コーパスに見る男性の言葉・女性の言葉」2017

    • Author(s)
      木部暢子・佐藤久美子・大槻知世
    • Organizer
      コ―パス合同シンポジウム「コーパスに見る日本語のバリエーション―話者の属性―」
  • [Book] 『日本の危機言語・方言の記録とドキュメンテーションの作成 島根県隠岐の島方言調査報告書』2018

    • Author(s)
      木部暢子編
    • Total Pages
      154
    • Publisher
      国立国語研究所
  • [Book] 『日本の危機言語・方言の記録とドキュメンテーションの作成 石川県白峰方言調査報告書』2018

    • Author(s)
      原田走一郎、新田哲夫編
    • Total Pages
      85
    • Publisher
      国立国語研究所
  • [Book] 『語彙論的統語論の新展開』2017

    • Author(s)
      日高水穂
    • Total Pages
      275
    • Publisher
      くろしお出版
    • ISBN
      9784874247488

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi