研究課題/領域番号 |
25284087
|
研究種目 |
基盤研究(B)
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
木部 暢子 大学共同利用機関法人人間文化研究機構国立国語研究所, 時空間変異研究系, 教授 (30192016)
|
研究分担者 |
井上 文子 大学共同利用機関法人人間文化研究機構国立国語研究所, 時空間変異研究系, 准教授 (90263186)
小林 隆 東北大学, 文学研究科, 教授 (00161993)
三井 はるみ 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・構造研究系, 助教 (50219672)
新田 哲夫 金沢大学, 歴史言語文化学系, 教授 (90172725)
日高 水穂 関西大学, 文学部, 教授 (80292358)
五十嵐 陽介 広島大学, 文学研究科, 准教授 (00549008)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 言語学 / 国語学 / 音声学 / 方言学 / 方言コーパス / 方言データベース |
研究概要 |
本研究の目的は、これまで未整備だった日本語方言コーパスを作成すること、それを使った方言の分析研究を行うこと、及び、方言コーパスの作成を通じて、消滅の危機にある方言を記録・保存・公開することの3点である。25年度は3年計画の1年目にあたる。そのため、方言コーパス作成のための基礎作業となる方言データベースの整備に重点を置いて研究を実施した。具体的内容は、以下のとおりである。 (1)方言データベースの作成:国立国語研究所が所蔵する「各地方言収集緊急調査」の音声データのうち、青森県弘前市、東京都台東区、石川県羽咋郡押川、大阪市、兵庫県相生市、広島市、福岡県北九州市の7地点、各30分のデータをサンプルとして、方言テキスト、共通語訳のデータの整備を行った。その際、次のような手順を踏んだ。まず、情報処理を専門とする研究者からデータ整備の方法や具体的な作業行程についての助言を受け、データベース作成上の問題点を全メンバーで共有し、次に、本研究におけるデータ整備の方針や方法について検討した。その後、上記7地点の方言音声データ・方言テキストデータ・共通語訳データの整備を行い、方針や方法の見直しを行った。 (2)共通語~方言検索システムの開発:青森県弘前市、東京都台東区の2地点をサンプルとして、共通語から方言を検索するシステムを導入し、方言コーパスの試作版を作成した。また、コーパスを使った方言研究の試行を行った。その結果、格表現、モダリティー表現、イントネーション等、出現頻度の高い言語現象の研究には方言コーパスが有効に働くことが分かった。 (3)音声データの編集:方言テキスト・共通語訳の整備に併せて、方言音声データを公開するための編集作業を開始した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
方言データベースの作成に関しては、7地点、各30分のデータをサンプルとしてデータ整理を行い、整理上の問題や留意点をリストアップした。それにより、今後、大量の音声データ、テキストデータを整備する見通しを立てることができた。また、研究メンバーの間で、データベース作成の方針に関する共通理解を形成することができた。 方言コーパスの構築とそれを使った方言研究については、青森県弘前市、東京都台東区の2地点の方言をサンプルとして共通語~方言検索システムの試作版を作成し、格表現、モダリティー表現、イントネーション等、出現頻度の高い表現の研究に方言コーパスが有効であるという結果を得た。これにより、今後の方言コーパスの利用に関する見通しを立てることができた。 音声データの整備・編集については、25年度末から上記7地点のうちの2地点を対象として整備・編集を開始した。この作業は、実際の音声を聞きながら手作業で音声を編集する作業で、当該方言に詳しい者でなければ実施できない。また、作業に膨大な時間がかかる。今後、大量の音声データを整備するためには、人材確保と作業時間の見通しを立てておく必要がある。25年度はその準備に取りかかった。
|
今後の研究の推進方策 |
今後は各地点のデータ量を増やして、方言データベースの内容の充実を図る。そのために、25年度に決定したデータ整備方針に従って、できるだけ長時間の方言音声資料のテキスト化と共通語訳の付与、及び、音声データの整備を行う。 検索システムについては、単語検索だけでなく、品詞による検索や短単位検索、長単位検索等、検索条件の精度を上げるよう、検索システムの改善を行う。それにより、コーパスを使った方言の分析の幅を広げることを目指す。 また、音声データを編集・整備してテキストデータとの関係付けを行い、方言テキストと同時に方言音声を聞くことができるようなシステムの開発を行う。そのためには、当該方言に関する知識と言語学的な知識、さらには情報処理の専門知識を有する人材が必要となる。そのような人材を確保する方策を講じつつ、方言コーパスの構築を行う。
|
次年度の研究費の使用計画 |
音声データの整備を当該地域の方言に詳しい人材に依頼する予定で謝金を組んでいたが、その人の都合により、25年度はその作業を依頼することが出来なくなった。この作業は、当該地域の方言の知識を有する者でなければできない作業であり、他に適当な作業者を見つけることができなかったため、予算を繰り越し、次年度に行うこととした。 音声データの整備と音声データとテキストデータのチェック作業を、当該地域の方言に詳しい人材に依頼する。作業は26年5月から9月にかけて行う。その謝金として、26年度繰り越し金を使用する。
|