Project/Area Number |
21H04351
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 2:Literature, linguistics, and related fields
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
木部 暢子 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 名誉教授 (30192016)
|
Co-Investigator(Kenkyū-buntansha) |
五十嵐 陽介 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (00549008)
中川 奈津子 九州大学, 人文科学研究院, 准教授 (50757870)
小西 いずみ 東京大学, 大学院人文社会系研究科(文学部), 准教授 (60315736)
中西 太郎 東北大学, 文学研究科, 准教授 (30613666)
白岩 広行 立正大学, 文学部, 准教授 (30625025)
大槻 知世 静岡英和学院大学, 人間社会学部, 准教授 (30805205)
籠宮 隆之 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源開発センター, プロジェクト非常勤研究員 (10528269)
|
Project Period (FY) |
2021-04-05 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥41,600,000 (Direct Cost: ¥32,000,000、Indirect Cost: ¥9,600,000)
Fiscal Year 2024: ¥9,880,000 (Direct Cost: ¥7,600,000、Indirect Cost: ¥2,280,000)
Fiscal Year 2023: ¥10,790,000 (Direct Cost: ¥8,300,000、Indirect Cost: ¥2,490,000)
Fiscal Year 2022: ¥10,790,000 (Direct Cost: ¥8,300,000、Indirect Cost: ¥2,490,000)
Fiscal Year 2021: ¥10,140,000 (Direct Cost: ¥7,800,000、Indirect Cost: ¥2,340,000)
|
Keywords | 日本語諸方言コーパス(COJADS) / 韻律句形成システム / 文末音調 / 文末詞 / フィラー / COJADS / 疑問文イントネーション / 格標示システム / 諸方言コーパス / 方言形態素解析辞書 |
Outline of Research at the Start |
大量の言語データによる自動翻訳システムや検索システムの開発が急速に進むなか、一方で少数言語や日本各地の音声言語(方言)はデータとして保存されないまま消滅しようとしている。本研究ではこのような日本各地の音声言語の談話資料をデータベース化し、記録・保存すると同時に、これらを音声付きのコーパスとして公開することにより言語研究、地域研究、歴史研究、音声言語処理研究等の諸分野の研究の基盤となる言語資源を整備する。また、上記のコーパスを活用して自然談話に現れる音調(イントネーション)、文末詞(終助詞)、フィラー(間投詞)、相づち等の分析を行い、談話における情報伝達システムの地域差を明らかにする。
|
Outline of Annual Research Achievements |
【研究実績の概要】(800字) 本研究の目的は、諸方言コーパスを整備・公開し、方言研究の基盤を構築すること、およびこれを利用して、音調句の形成システムや文末イントネーション、フィラー、相づちといった談話展開における諸現象の地域差を明らかにし、そのシステムを類型論的に解明することである。4年計画の2年目に当たり、以下のことを実施した。 (1)『日本語諸方言コーパス(COJADS)』に11時間分のデータを追加し、公開した。これによりCOJADS搭載データが全国64地点、91時間となった。これらのデータは、メタ情報付きのテキストCSV 形式データとして無償頒布するほか、音声データ、TextGridデータを有償で配布している(https://www2.ninjal.ac.jp/cojads/index.html)。また、COJADSの利用を促進するために、「『日本語諸方言コーパス』「中納言」オンライン講習会」を令和4年10月15日に開催した。 (2)COJADSの利用環境を向上させるために、日本語イントネーションのラベリングスキームX-JToBIを諸方言に応用する場合の問題点を検討し、口頭発表を行った(五十嵐)。また、フィラー・相づちの地域差を解明するためのデータ整備(中西、大槻)、方言の「形態素解析辞書」の開発(中川)、方言音声の個人情報処理(籠宮)等を行った。 (3)コーパスを利用し、以下の研究を行った。○日本語の格標示システム、特に、主語、目的語を無助詞で標示する現象と語順の関係についてCOJADSデータを分析し、研究発表を行った(木部)。また、福島県北部方言の談話資料をもとに格標示形式の分析を行い、論文を発表した(白岩)。○南琉球宮古語池間方言の疑問文イントネーション体系の調査を行い、初期報告を行った(五十嵐)。○山梨県奈良田方言や富山市方言を対象に終助詞のアクセント、疑問文の文末音調、フィラーの音調等について調査を行い、成果の一部を学術論文や学会等で発表した(小西)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
4年間の実施計画は、①コーパスデータの整備・拡張、およびコーパスの利用の拡大、②国際発信のための諸方言テキストのローマ字化、③コーパスを使った研究の推進である。現在までの進捗状況は以下のとおりである。 ①については、1年目に約20時間、2年目に約11時間のデータをCOJADSに追加し、令和5年3月現在でCOJADS搭載データが全国64地点、91時間となった。コーパスデータの整備・拡張を促進するために、令和4年度に科研費基盤(A)「『全国方言文法辞典』データベースの拡充による日本語時空間変異対照研究の多角的展開」と共同で「みんなで談話整備プロジェクト」を開始し、令和4年7月16日にシンポジウム「みんなで作って みんなで使おう」を開催して参加者を募った。現在約40名の登録者により方言データの整備を進めている。また、COJADSの活用を促進するために講習会をこれまで2回開催した(令和3年8月21日、令和4年10月15日。新型コロナウィルス感染拡大防止のためいずれもオンライン開催)。COJADSの利用も徐々に増え、令和5年4月1日現在でCOJADSを活用した論文や発表が論文11件、口頭発表32件、ポスター発表4件となっている。(https://www2.ninjal.ac.jp/cojads/index.html?targ=studies) ②については、48地点、24時間のコアデータを使って、片仮名テキストのローマ字化について検討した。鼻濁音や前鼻音、中舌母音、喉頭化音等に対しては、現在、独自の片仮名表記を用いているが、ローマ字化に際しては、IPAを考慮した表記法の開発を行っている。 ③については、格標示形式に関する研究、疑問文イントネーションの研究、終助詞、フィラー、相づちに関する研究等を行った。格標示形式、疑問文イントネーションに関する研究では新たな知見が得られている。
|
Strategy for Future Research Activity |
研究計画に沿って、今後、以下の研究を推進する。 ・研究基盤となるコーパスの整備・拡張を行う。令和4年度から始めた「みんなで談話整備プロジェクト」と連携してデータのチェック、テキストと音声との紐付け等を行うことにより、データ整備作業がより効率的に行えるようになった。 ・当初の計画にはなかったが、諸方言の「形態素解析辞書」の開発を行い、方言形を直接検索する機能の開発に取り組む。その手始めとして「近世上方語UniDic」を応用して「関西方言形態素解析辞書」を試作し、次第に他の地域の「形態素解析辞書」の開発につなげていく予定である。琉球諸語については既存のUniDicの応用が難しいため、琉球語の辞典から「形態素辞書」を作成するなどの方法を考える。 ・日本語諸方言データの国際的な活用を可能にするために、48地点、24時間のコアデータに対して方言テキストのローマ字化、および発話内容の英訳を行う。 ・COJADSを初めとする諸方言コーパスを使った方言研究をさらに推進する。格標示形式、疑問文イントネーションに関しては、これまでの分析で地域差が明らかとなり、新たな知見を得ている。今後、文末詞、フィラー、相づち等の研究を進め、コーパスに基づく方言研究をさらに展開する。
|