2021 Fiscal Year Research-status Report
Classification of regional dialects in Japanese
Project/Area Number |
20K20702
|
Research Institution | The University of Tokushima |
Principal Investigator |
服部 恒太 徳島大学, 大学院社会産業理工学研究部(社会総合科学域), 講師 (10758387)
|
Co-Investigator(Kenkyū-buntansha) |
岸江 信介 奈良大学, 文学部, 教授 (90271460)
|
Project Period (FY) |
2020-07-30 – 2023-03-31
|
Keywords | DBSCAN / Pilot study |
Outline of Annual Research Achievements |
私たちは、感染拡大が続いているCOVID-19による混乱に直面し、期待したほどの進展を得ることができなかった。昨年、私たちはオンライン実験を提案し、幅広い参加者から遠隔でデータを収集できるように提案を行なった。私たちは、数ヶ月かけて実験デザインを練り直し、『お国ことばを知る方言の地図帳』に収録されている14人の年配の日本語話者を録音を用いた知覚実験を立ち上げた。また、私たちはパイロット研究を開始し、約30名の日本語母語話者にその古い日本語話者の出身を推定してもらった。しかし、ネットでの参加者募集が予想以上に困難であることが問題であると判明した。現在、どのようにすればより多くの参加者をオンラインで効率的に集められるかを議論している。
一方、パイロットデータをどのように分析するかという検討も始めている。昨年は、判別分析や自己組織化マップを検討した。しかし、最初はDBSCAN(Density-based spatial clustering of applications with noise)でデータを分析した方が良さそうに思われた。そこで、方言関連のプロジェクトでこの手法が有効かどうかを検証するために、別のプロジェクトで得られたデータセットを用いて、関西弁の話者がどのように分類されるかを検証した。その結果、関西の北部と東北部(兵庫県北部、滋賀県、三重県北部)の話者は似たような話し方をしていること、そして、大阪府と和歌山県の話者は他の話者グループから独立していることが明らかになった。これは、これらの方言は関西の他の方言とは異なることを示唆している。本研究は、方言の国際学会であるMethodsに採択され、2022年8月にドイツで発表する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
このプロジェクトには二つの実験がある。ひとつは、年配の日本語話者が話すさまざまな日本語を、若者や中年世代がどのように分類しているかを調べるものである。もうひとつは、現在の20代前半の若者が話すさまざまな日本語を、異なる世代の日本語話者がどのように分類しているかを調べるものである。前者は前述したように、現在進行中である。後者はまだ準備中である。昨年度は22人の若い日本語話者から音声サンプルを収集した。2021年には、さらに数人の話者から録音を行うことができた。しかし、この実験では、新型コロナウイルスにより旅行ができなかったため、希望する話者との録音はできないままになっている。この実験のデザインは、基本的に一つ目の実験と同様である。したがって、すべての録音が揃った時点で、実験を開始することができると考えている。
|
Strategy for Future Research Activity |
私たちは、さらなる実験の進展のために、効果的な戦略を見極める必要がある。両実験の最大の課題は、参加者の効果的な募集方法を見つけることである。私たちは、外部の人たち(例えば、学会での聴衆)と話す機会があったとき、いくらかのボランティアを探すことができた。しかし、私たちはうまく参加者を集めることができなかった。サンプル数を増やすためには、まずは大学の学生や関係者を集める必要があるように思われる。私たちはいくつかの大学とコネクションを持っている。そこで、その大学の学生や関係者にお願いしようと考えている。また、謝礼を用意することで、参加者を募ることも必要だと考えている。今年は、Twitterなどのソーシャルメディアのアカウントを作成し、広く参加者を募集することを検討している。もし、参加者が思うように集まらなければ、このプロジェクトの1年延長を検討する予定である。
|
Causes of Carryover |
COVID-19のパンデミックの影響で、思うようにデータを集めることができなかった。そのため、前年度からの繰り越しの予算が生じている。2022年度は、以下のことを行う予定である。第一に、ドイツで開催される第17回国際方言学会議(the Seventeenth International Conference on Methods in Dialectology)において、研究発表を行う。第二に、実験の参加者を増やすための謝礼に用いる。第三に、日本のいくつかの地域(例えば、南九州、山陰地方など)へ行き、自分の地域では得られない音声サンプルを収集する。最後に、機械学習によるデータ解析のために、高性能のコンピュータを必要とする。次年度使用額は次年度の予算と合わせて、これらの費用に使用する予定である。
|
Research Products
(1 results)