2016 Fiscal Year Annual Research Report
日本語諸方言コーパスの構築とコーパスを使った方言研究の開拓
Project/Area Number |
16H01933
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
木部 暢子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 教授 (30192016)
|
Co-Investigator(Kenkyū-buntansha) |
五十嵐 陽介 一橋大学, 大学院社会学研究科, 准教授 (00549008)
田附 敏尚 神戸松蔭女子学院大学, 文学部, 講師 (90645813)
新田 哲夫 金沢大学, 歴史言語文化学系, 教授 (90172725)
三井 はるみ 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 助教 (50219672)
椎名 渉子 フェリス女学院大学, 国際センター, 講師 (70765685)
日高 水穂 関西大学, 文学部, 教授 (80292358)
井上 文子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 准教授 (90263186)
熊谷 康雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 准教授 (30215016)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | 方言談話資料 / 文化庁「各地方言収集緊急調査」 / 方言の横断検索 / ふるさとことば集成 / 格標示形式の地域差 / 方言テキスト / 標準語テキスト / タグ付け |
Outline of Annual Research Achievements |
本研究の目的は、(1)各地方言の談話資料を整備し、諸方言を横断的に検索する「日本語諸方言コーパス」を構築すること、(2)作成したコーパスを使って言語分析を行い、新しい方言研究の方法を提示すること、(3)方言データを整備することにより、急速に衰退が進む日本各地の消滅危機言語・方言の記録・保存・公開を行うことの3点である。28年度は5年計画の1年目にあたる。実施内容は以下のとおりである。 (1)データの整備:資料は文化庁の「各地方言収集緊急調査」(1977~1985 年実施)の談話資料を使用し、最終年度までに75時間の全国方言方言データよりなるコーパスを公開する。このデータは、方言音声、転記テキスト(方言テキスト)、標準語訳(標準語テキスト)の3つよりなる。本コーパスではパラレル・コーパスの考え方に基づき、標準語形から方言テキストと方言音声を検索する方法をとっている。そのため、この3つのデータをお互いに紐付けする必要がある。28年度は上記資料のうち『ふるさとことば集成』(国書刊行会)所収のデータ(47地点、各約30分)につき、この作業を行った。また、作業の均質化を図るために、作業マニュアルを作成し、共通理解のもとに作業を進めた。 (2)コーパスを使った言語分析:整備したデータをもとに、諸方言の格標示形式に関する研究、1人称代名詞「ア」「ワ」に関する研究、授与動詞「クレル」「ヤル」に関する研究、韻律に関する研究等の研究を行い、学会、研究会、論文等で発信した。 (3)消滅危機言語・方言の記録・保存:上記の作業と研究を通して、言語・方言のデータ整備を行った。30年度に限定公開し、最終年度に一般公開する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
・『ふるさとことば集成』所収の47地点のデータに関しては、音声データの整備、音声データと方言テキストとの紐付け作業をほぼ終えた。標準語テキストの紐付けについては、パイロット的に数地点の作業を行った。 ・上記の作業を均質的に実施するために、作業マニュアルを作成した。作業マニュアルは、方言テキストの表記、標準語テキストの作成、検索のためのタグ付け等からなる。マニュアルの作成にあたっては、国立国語研究所コーパス開発センターや先行のコーパスプロジェクトから助言を受け、また、作業を進める中で順次、更新していった。 ・これらに加え、『ふるさとことば集成』未収録のデータの整備に着手した。未収録データは、方言テキストと標準語テキストのネイティブ・チェックを必要とする。そのため、28年度は約20地点につきデータのチェック担当者を決定し、作業に入った。 ・言語分析に関しては、「対格表現の地域差 -助詞ゼロをめぐって-」(東京外国語大学語学定例研究会)、「諸方言の『やる・くれる・もらう』-テキストを使った方言研究-」(九州方言研究会)等の研究発表、及び「地域語に見る大和言葉」(『日本語学』)等の研究論文を発表した。また、日本語学習者コーパス、歴史コーパス、会話コーパスの研究グループと合同でコーパス合同シンポジウム「コーパスに見る日本語のバリエーション―助詞のすがた―」(2017年3月9日、国立国語研究所)を開催し、コーパスの作成と活用の問題点について議論した。
|
Strategy for Future Research Activity |
・『ふるさとことば集成』収録の47地点、各約30分のデータについては、29年度中に標準語テキストの整備を終え、30年度に検索システムを組み、30年度中に限定公開を行う。『ふるさとことば集成』未収録のデータについては、毎年20地点、各1時間のデータの整備を行い、平成32年度までに60時間の方言データを整備する。最終年度までには、『ふるさとことば集成』収録・未収録データを合わせて75時間の方言データを整備し、「日本語諸方言コーパス」の一般公開に備える予定である。 ・作業を効率的に行うために、作業の自動化について検討を行っており、実験的に一部の作業に自動化を導入している。それに伴い、作業マニュアルを順次、更新し、充実させる。 ・コーパスを活用した研究については、これまで、格標示形式の地域差、授与動詞の地域差、イントネーションの地域差等の研究を行ってきた。今後、データの充実に伴い、コーパスを活用することにより言語研究がどのような新展開を生むのかを追究し、発表する。
|