Project/Area Number |
21H04351
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 2:Literature, linguistics, and related fields
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
木部 暢子 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 名誉教授 (30192016)
|
Co-Investigator(Kenkyū-buntansha) |
五十嵐 陽介 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (00549008)
中川 奈津子 九州大学, 人文科学研究院, 准教授 (50757870)
小西 いずみ 東京大学, 大学院人文社会系研究科(文学部), 准教授 (60315736)
中西 太郎 東北大学, 文学研究科, 准教授 (30613666)
白岩 広行 立正大学, 文学部, 准教授 (30625025)
大槻 知世 静岡英和学院大学, 人間社会学部, 准教授 (30805205)
籠宮 隆之 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源開発センター, プロジェクト非常勤研究員 (10528269)
|
Project Period (FY) |
2021-04-05 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥41,600,000 (Direct Cost: ¥32,000,000、Indirect Cost: ¥9,600,000)
Fiscal Year 2024: ¥9,880,000 (Direct Cost: ¥7,600,000、Indirect Cost: ¥2,280,000)
Fiscal Year 2023: ¥10,790,000 (Direct Cost: ¥8,300,000、Indirect Cost: ¥2,490,000)
Fiscal Year 2022: ¥10,790,000 (Direct Cost: ¥8,300,000、Indirect Cost: ¥2,490,000)
Fiscal Year 2021: ¥10,140,000 (Direct Cost: ¥7,800,000、Indirect Cost: ¥2,340,000)
|
Keywords | 日本語諸方言コーパス(COJADS) / 韻律句形成システム / 文末音調 / 文末詞 / フィラー / 文末のイントネーション / 疑問文のイントネーション / 文末詞のアクセント / 相づち / COJADS / 疑問文イントネーション / 格標示システム / 諸方言コーパス / 方言形態素解析辞書 |
Outline of Research at the Start |
大量の言語データによる自動翻訳システムや検索システムの開発が急速に進むなか、一方で少数言語や日本各地の音声言語(方言)はデータとして保存されないまま消滅しようとしている。本研究ではこのような日本各地の音声言語の談話資料をデータベース化し、記録・保存すると同時に、これらを音声付きのコーパスとして公開することにより言語研究、地域研究、歴史研究、音声言語処理研究等の諸分野の研究の基盤となる言語資源を整備する。また、上記のコーパスを活用して自然談話に現れる音調(イントネーション)、文末詞(終助詞)、フィラー(間投詞)、相づち等の分析を行い、談話における情報伝達システムの地域差を明らかにする。
|
Outline of Annual Research Achievements |
本年度は、4年計画の3年目にあたる。実施内容は以下のとおりである。 (1)『日本語諸方言コーパス(COJADS)』に10地点のデータ約5時間分(自然談話、語りを含む)を追加・公開した。これによりCOJADS搭載データは全国66地点、合計約97時間分となった。 (2)COJADSの利用を促進するために、講習会等を以下の3回開催した。①令和5年8月26日説明会&講習会「みんなで談話整備プロジェクト 文化庁『各地方言収集緊急調査』資料の整備と活用」(オンライン)。内容:『各地方言収集緊急調査』資料をできるだけ多くの人で整備するための説明会・講習会。②令和5年11月5日「NINJALシンポジウム「コーパス利用のべし・べからず」(オンライン)。内容:COJADSを含む諸コーパスを活用する際の注意事項と活用の可能性に関する講習会。③令和5年12月4日「COJADS講習会」(東北大学)。内容:COJADSの利活用を促進するための講習会。 (3)方言コーパスデータ、および調査データを元にして、以下の研究を行った。①山梨県奈良田方言の付属語のアクセントの分析。②福島県北部方言、富山市方言、山梨県奈良田方言の文末イントネーションに関する研究、および、日本語・琉球諸語の疑問文のイントネーションに関する研究。③フィラー・相づちの地域差を解明するための、コーパスのデータの整備、およびコーパスのデータを補うための通信調査。④COJADSデータを利用したヴォイスの分析。⑤関西方言の「形態素解析辞書」の開発。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、①コーパスデータの整備・拡張、およびコーパスの利用の拡大、②国内外への発信のための諸方言テキストのローマ字化、③コーパスを使った研究の推進を行う。現在まで以下のことを実施した。これらから、おおむね順調に展開していると判断される。 ①については、1年目に約20時間、2年目に約11時間、3年目に約5時間のデータをCOJADSに追加し、令和6年3月までに搭載データが約97時間となった。方言データの整備・拡張を効率的に行うために、令和4年度から科研費基盤(A)「『全国方言文法辞典』データベースの拡充による日本語時空間変異対照研究の多角的展開」(20H00015)と共同で「みんなで談話整備プロジェクト」を開始した。これにより、2024年3月時点で16件のデータセットが国立国語研究所の機関リポジトリーで公開されている。今後、これらに対してCOJADS搭載のためのデータ整備を行う予定である。また、COJADSの活用の促進のために、これまで講習会を5回開催した(令和3年8月21日、令和4年10月15日、令和5年8月26日、令和5年11月5日、令和5年12月4日)。これらの活動の結果、COJADSを利用した研究は、年々増加しており、令和5年度末の段階で論文17件、口頭発表34件、ポスター発表6件、講演等15件の研究でCOJADSが利用されている。 ②については、48地点、24時間のコアデータを使って、片仮名テキストのローマ字化に関する検討を行った。現在、地点ごとに特殊な表記が使われている箇所がある。それらを見直し、IPAを考慮した統一的表記法の検討を行った。 ③については、格標示形式の地域差の分析に加え、文末イントネーション、疑問文イントネーション、フィラー・相づちの地域差の分析を進め、新たな知見が得られた。これらの成果は近々、公開する予定である。
|
Strategy for Future Research Activity |
研究計画に沿って、今後、以下の研究を推進する。 ①研究基盤となるCOJADSの整備・拡張を引き続き行う。科研費基盤(A)20H00015と共同で始めた「みんなで談話整備プロジェクト」により整備された方言のテキスト・標準語テキストをCOJADSに搭載するための作業を進める。 ②当初の計画にはなかったが、方言の形態素解析辞書の開発を行う。国立国語研究所共同研究プロジェクト「多様な語彙資源を統合した研究活用基盤の共創」、科研費基盤(A)「日本語諸方言の形態素解析用辞書の構築と活用」(23H00007)と連携して、この開発を進める。 ③日本語諸方言データを国際的に発信するために、48地点、24時間のコアデータの方言テキストのローマ字化を行う。 ④COJADSを含む諸方言コーパスを使った方言研究をさらに推進する。格標示形式の地域差については、すでに研究成果を公開した。今後、文末イントネーションの地域差、疑問文のイントネーションの地域差、フィラー、相づち等の地域差に関する研究を進め、研究成果を公開する。
|