2021 Fiscal Year Annual Research Report
日本語諸方言コーパスによる方言音調の比較類型論的研究
Project/Area Number |
21H04351
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
木部 暢子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 特任教授 (30192016)
|
Co-Investigator(Kenkyū-buntansha) |
五十嵐 陽介 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 教授 (00549008)
小西 いずみ 東京大学, 大学院人文社会系研究科(文学部), 准教授 (60315736)
中西 太郎 跡見学園女子大学, 文学部, 准教授 (30613666)
白岩 広行 立正大学, 文学部, 准教授 (30625025)
大槻 知世 静岡英和学院大学, 人間社会学部, 講師 (30805205)
中川 奈津子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 特任助教 (50757870)
籠宮 隆之 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 特任助教 (10528269)
|
Project Period (FY) |
2021-04-05 – 2025-03-31
|
Keywords | COJADS / 韻律句形成システム / 文末音調 / 文末詞 / フィラー / 方言形態素解析辞書 |
Outline of Annual Research Achievements |
本研究の目的は、諸方言の談話音声をデータとする方言コーパスを整備・公開し、方言研究の基盤を構築すること、及びこれを利用して、音調句の形成のしかたや文末イントネーションといった談話における音調現象や、フィラー・相づち等の地域差を明らかにし、そのシステムを類型論的に解明することである。本年度は4年計画の1年目に当たり、以下のことを実施した。 (1)『日本語諸方言コーパス』モニター版のデータと検索機能を整備・拡充し、約80時間の方言談話データによる『日本語諸方言コーパス(COJADS)』を正式公開した。また、全データの配布方法を簡素化し、利用しやすいように環境を整備した。 (2)COJADSにおける方言の検索機能を充実させるために、国語研のコーパス開発センターの指導を受けて、方言の「形態素解析辞書」の開発の可能性について検討を行った。関西方言に関しては、すでに公開されている「近世上方語UniDic」を応用して「関西方言形態素解析辞書」の作成が可能ではないかという指摘を受け、試作することとなった。 (3)コーパスを利用した研究を推進するために、研究会を3回開催し、討論を行った。発表テーマは「談話データへの音声ラベルの付与に関する研究」「富山市方言における文末音調の研究」「フィラーに関する研究」である。また、方言コーパスやデータベースを使った研究成果を論文や学会等の発表で公開した。 (4)日本語諸方言データの国際的な活用をめざして、方言テキストのローマ字化と発話内容の英訳を行う計画である。本年度はコアとなる48地点、24時間のデータを使って、ローマ字化に際しての方言テキストの表記の問題点を抽出した。 (5)COJADSの活用を促進するために、若手研究者を主な対象とする「日本語諸方言コーパス講習会」をオンラインで開催した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
4年間の実施計画は、①データの整備・拡張(毎年度約10~20時間の各地方言談話データの整備)、②国際発信のための諸方言テキストのローマ字化(コアデータ24時間の方言テキストのローマ字化)、③諸方言コーパスを使った研究(音調現象、フィラー等の地域差の解明と類型化)の推進である。これらに対し、令和3年度は以下のことを実施した。 ①については、約21時間分のデータを新たに整備し、令和4年3月にコーパス検索アプリケーション中納言で公開した。データの内訳は、全国16都府県19地点の自然談話、場面設定、語りである。これにより、COJADSの搭載データは約80時間となった(https://www2.ninjal.ac.jp/cojads/index.html?targ=news)。 ②については、48地点、24時間のコアデータを使って、ローマ字化の際の問題に検討を行った。特に、標準語と音素体系を異にする東北方言、琉球語については、ローマ字表記にIPAを考慮する必要があるため、別途表記法を検討した。 ③については、研究会を3回開催し、「談話データへの音声ラベルの付与に関する研究」「富山市方言における文末音調の研究」「フィラーに関する研究」の発表とそれに関する討論を行った。また、方言コーパスやデータベースを使った研究成果を『日本語の格表現』(勉誠出版)や「丁寧表現形式「デス」の地域差―日本語諸方言コーパス(COJADS)から―」等で公開した。 これらに加え、令和3年度は、方言の形態素検索に必要な「各地方言の形態素解析辞書」の作成について検討を進め、「関西方言形態素解析辞書」については、既公開の「近世上方語UniDic」を応用して今後、試作することとなった。 以上のようにほぼ計画どおり進捗している。
|
Strategy for Future Research Activity |
研究計画に沿って、今後、以下のことを推進する。 ・毎年度約10~20時間の各地方言談話データの整備・公開を進める。データ整備に関しては、令和4年度以降、方言文法研究会の協力を得ながらネイティブ・チェック、及び音声とテキストとの紐付け作業を行う予定で、これにより、データ整備を効率化できる見通しである。 ・当初の計画にはなかったが、方言形を直接検索する機能の開発に取り組む。そのために、諸方言の「形態素解析辞書」の開発を行う。手始めとして「近世上方語UniDic」を応用して「関西方言形態素解析辞書」を試作し、次第に他の地域の「形態素解析辞書」の開発につなげていく予定である。ただし、琉球諸語については既存のUniDicの応用が難しいため、琉球語の辞典から「形態素辞書」を作成する方法を考える必要がある。 ・日本語諸方言データの国際的な活用を可能にするために、方言テキストのローマ字化、及び発話内容の英訳を進める。ローマ字化に関しては、標準語と音素体系が類似する方言の場合、標準語のローマ字表記法を応用することができるが、標準語と音素体系を異にする東北方言や琉球語に関しては、標準語のローマ字表記法が応用できないため、IPAを考慮しつつローマ字化規則を策定する必要がある。コアデータを使ってそれを試行する。 ・毎年、研究会を開催し、COJADSを初めとする諸方言コーパスを使った諸方言音調の分析、フィラー・相づち等の分析を進める。また、論文や学会等で研究成果を発表し、4年目に研究成果をまとめる。
|
Research Products
(14 results)