2017 Fiscal Year Annual Research Report
日本語諸方言コーパスの構築とコーパスを使った方言研究の開拓
Project/Area Number |
16H01933
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
木部 暢子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 教授 (30192016)
|
Co-Investigator(Kenkyū-buntansha) |
井上 文子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 准教授 (90263186)
三井 はるみ 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 助教 (50219672)
新田 哲夫 金沢大学, 歴史言語文化学系, 教授 (90172725)
日高 水穂 関西大学, 文学部, 教授 (80292358)
五十嵐 陽介 一橋大学, 大学院社会学研究科, 准教授 (00549008)
田附 敏尚 神戸松蔭女子学院大学, 文学部, 講師 (90645813)
椎名 渉子 フェリス女学院大学, 留学生センタ-, 講師 (70765685)
熊谷 康雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 准教授 (30215016)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | 方言コーパス / 諸方言の横断検索 / 方言談話資料 / 対格標示形式の地域差 / 疑問文の文末音調の地域差 / 日本のふるさとことば集成 / 各地方言収集緊急調査 |
Outline of Annual Research Achievements |
本研究の目的は、諸方言を横断的に検索する「日本語諸方言コーパス」を構築・公開すること、コーパスを使って言語分析を行い、新しい方言研究の方法を提示すること、方言データを整備することにより、各地の消滅危機言語・方言の記録・保存・公開を行うことである。29年度は5年計画の2年目にあたる。実施内容は以下のとおりである。 コーパス構築のためのデータは、文化庁の「各地方言収集緊急調査」(1977~1985 年調査)の談話資料を使用している。今年度はこのうち、『日本のふるさとことば集成』(国書刊行会)所収の24時間分のデータにつき、談話音声・方言テキスト・標準語テキストの3者のアラインメント作業、及び検索のためのタグ付け作業を完了した。また、文化庁の「各地方言収集緊急調査」データのうち、『日本のふるさとことば集成』未収録データの整備を開始し、24時間分の音声データに対して方言テキストと標準語訳テキストのネイティブ・チェックを行なった。これらの作業を共同で行うためには、各地点のデータ整備の方法を共有化しておく必要がある。そのために研究打合せを2回開催し、方言テキスト、標準語テキストの表記方法、タグ付け等の整備方式を確定した。これを受けて、『方言コーパス構築のための作業マニュアル』を作成した。 整備したデータをもとに方言を分析し、以下の発表を行なった。①一人称代名詞の男女差に関する考察、②疑問文の文末音調に上昇調タイプ、下降調タイプ、疑問形式の有無に依存するタイプといった地域差があること、③対格標示形式(「を」など)の地域差、④富山方言における「と抜け」(引用標識の「と」を使用しないこと)の特徴。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
文化庁の「各地方言収集緊急調査」のうちの『日本のふるさとことば集成』(国書刊行会)所収の24時間分のデータにつき、談話音声・方言テキスト・標準語テキストの3者のアラインメント作業、及び検索のためのタグ付け作業を終えた。また、これらのデータに関して試験的に検索システムを導入した。 文化庁「各地方言収集緊急調査」の未公開データ(『日本のふるさとことば集成』未収録データ)のうち、24時間分のデータ(24地点×1時間)に対して、方言テキストと標準語テキストのネイティブ・チェックを行い、次年度以降、音声とテキストの紐付け作業とタグ付け作業を行う準備を整えた。 上記の作業のための『方言コーパス構築のための作業マニュアル』を作成した。マニュアルの作成にあたっては、国立国語研究所のコーパス開発センターや先行のコーパスプロジェクト、情報学の研究者から助言を受けるとともに、研究打合せを2回開催して、順次、内容を更新した。マニュアルは来年度公開する予定である。 コーパスを使った方言分析を行い、国際学会、国内学会等で発表した。今年度までは本コーパスを非公開としているため、すべて科研担当者による発表である。次年度以降はコーパス・モニター版を公開し、活用を促進する予定である。
|
Strategy for Future Research Activity |
今後は、整備を終えた『日本のふるさとことば集成』収録の47地点、24時間分のデータに対して中納言による検索機能を付加し、30年度に『日本語諸方言コーパス モニター版』を公開する。それにより、コーパスを活用した方言研究を学界等において広く推進する予定である。同時に、方言コーパスを利用する際の注意点等についても検討し、公開する予定である。 コーパスのデータ量を増やすために、文化庁の「各地方言収集緊急調査」の未公開データの整備を引き続き行う。最終年度までにデータ量を75時間分に増やす予定である。 作業を効率的に行うために、作業の自動化を進める。29年度は音声と方言テキストのアラインメント作業の一部について自動化を行った。今後は、さらに自動化できる部分はどこかの検討に入り、自動化を推進する。なお、作業の自動化にあたっては、先行する諸コーパス(BCCWJ, CSJ, CJH)の担当者や情報学の研究者の助言を受け、方言辞書の作成も視野に入れた検討を行う。それに伴い、作業マニュアルを順次更新し、充実させた上で公開する。
|
Research Products
(16 results)