2019 Fiscal Year Annual Research Report
日本語諸方言コーパスの構築とコーパスを使った方言研究の開拓
Project/Area Number |
16H01933
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
木部 暢子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 教授 (30192016)
|
Co-Investigator(Kenkyū-buntansha) |
新田 哲夫 金沢大学, 歴史言語文化学系, 教授 (90172725)
日高 水穂 関西大学, 文学部, 教授 (80292358)
五十嵐 陽介 一橋大学, 大学院社会学研究科, 教授 (00549008)
三井 はるみ 國學院大學, 文学部, 教授 (50219672)
椎名 渉子 名古屋市立大学, 大学院人間文化研究科, 准教授 (70765685)
田附 敏尚 神戸松蔭女子学院大学, 文学部, 准教授 (90645813)
井上 文子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 准教授 (90263186)
熊谷 康雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 准教授 (30215016)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | コーパス言語学 / COJADS / 方言の横断検索 / 中納言 / 推量表現の地域差 / 音声とテキストの自動アラインメント |
Outline of Annual Research Achievements |
本研究は、(1)諸方言を横断的に検索する日本語諸方言コーパスを構築・公開すること、(2)コーパスを使って言語分析を行い、新しい方言研究の方法を提示すること、(3)方言データを整備することにより各地の消滅危機言語・方言の記録・保存・公開を行うことを目標としている。令和元年度(本研究4年目)は以下のことを実施した。 ・昨年度公開した『日本語諸方言コーパス(COJADS; Corpus of Japanese Dialects)』モニター版(中納言検索)のデータの不備を修正しアップデートするとともに、新たに全国12府県14地点のデータ約11時間分を追加・公開した。また、ホームページを開設し、各地点の全テキストデータがホームページから一括ダウンロードできるようにした。 ・「データ作成方針」(データの構成、方言テキストの作成方針、標準語テキストの作成方針、文節認定規則、タグ一覧)をホームページで公開し、利用環境を充実させた。 ・COJADSを使った研究の成果を日本方言研究会、日本語学会、LPSS2019(台湾)等、国内外の学会で発表した。また、COJADSを使って格表現、推量表現の地域差に関する研究を行い、今年度は推量表現の地域差に関する論文を発表した。 ・公開シンポジウム「方言コーパスを活用した方言研究の開拓」を開催し、COJADSの利用講習と研究発表を行なった。また、他のコーパス開発プロジェクトと合同で公開シンポジウム「コーパスに見る日本語のバリエーション ―くだけた表現―」を開催し、日本語コーパス開発のネットワークを構築した。 ・データ整備の効率化のために、音声とテキストの自動アラインメント実験を実施したが、現状では実用が難しいことが分かった。特に、複数話者による自然談話データでは、話者の識別を自動的に行うことが困難で、結局、人間の耳で確認することとなった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
・昨年度、47都道府県、24時間分のデータよりなるCOJADSモニター版を公開した。今年度は、新たに全国12府県14地点のデータ約11時間分の自然談話データを追加・公開した。また、来年度のデータの追加・公開に向けて、新たに25時間分のデータの整備を行なった。 ・COJADSモニター版の公開後、データの不備がいくつか見つかった。今年度、これらの不備を修正し、データのアップデートを行なった。また、昨年度までは検索箇所のデータのダウンロードしかできなかったが、今年度はこれを改善し、各地点の全データがホームページから一括ダウンロードできるようにした。また、ホームページで「データ作成方針」を公開した。 ・コーパスを使った新たな方言研究の開拓を進めた。今年度は、本研究のスタッフが11件の研究発表を国内外の学会で行なったほか、公開シンポジウム「方言コーパスを活用した方言研究の開拓」、合同シンポジウム「コーパスに見る日本語のバリエーション―くだけた表現―」を開催し、COJADSを活用した研究の普及に努めた。また、COJADSモニター版を使って、格体系、推量表現の地域差に関する研究を推進し、今年度は推量表現の論文を発表した。 ・COJADSモニター版は、公開後1年で登録ユーザー数が3,000人を超え、方言研究及び一般社会で広く利用されている。
|
Strategy for Future Research Activity |
・今後、COJADSのデータの拡張を進める。来年度は35時間分のデータを追加・公開し、合計で70時間のデータの公開をめざす。また、タグ情報で検索する機能を追加する。 ・今年度、各地点の全テキストデータの一括ダウンロードができるようにした。今後は音声データの頒布を予定している。なお、音声データは容量が大きいため、オンラインでのダウンロードではなく、保存メディアによる頒布を予定している。 ・コーパスを使った方言研究を普及するため、今後、COJADSモニター版の利用講習会や発表会を開催する。また、卒論や修論でのCOJADSモニター版の活用を促進し、COJADSによる若手研究者の支援を積極的に行う。そのために今後、できるだけ早く「COJADS中納言検索ガイド」を公開し、COJADSの利用環境を整備する。 ・COJADSの構築における方言音声と方言テキストの自動アラインメントは、まだ、実用が難しいことが分かった。そのため、構築工程のうち、音声の分節までは自動で行い、そのあとの、方言音声と方言テキストのアラインメントは、これまでどおり手作業で行うこととした。自動的なアラインメント実験や方言辞書の自動作成の実験については、引き続き、別のプロジェクトで実施する。
|
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] Demonstration of Corpus Concordance Systems: Chunagon and Kotonoha2019
Author(s)
Hanae Koiso, Masayuki Asahara, Salvatore Carlino, Ken'ya Nishikawa, Kazuki Aoyama, Yuichi Ishimoto, Aya Wakasa, Michiko Watanabe, Yoshimi Yoshikawa, Nobuko Kibe, Kikuo Maekawa
Organizer
The 3rd International Symposium on Linguistic Patterns in Spontaneous Speech
Int'l Joint Research
-
-
-
-
-
-