研究課題/領域番号 |
25284087
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
木部 暢子 大学共同利用機関法人人間文化研究機構国立国語研究所, 時空間変異研究系, 教授 (30192016)
|
研究分担者 |
五十嵐 陽介 広島大学, 文学研究科, 准教授 (00549008)
三井 はるみ 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・構造研究系, 助教 (50219672)
日高 水穂 関西大学, 文学部, 教授 (80292358)
新田 哲夫 金沢大学, 歴史言語文化学系, 教授 (90172725)
井上 文子 大学共同利用機関法人人間文化研究機構国立国語研究所, 時空間変異研究系, 准教授 (90263186)
田附 敏尚 神戸松蔭女子学院大学, 文学部, 講師 (90645813)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 日本語諸方言 / 方言談話資料 / 音声データ / 方言テキストデータ / 方言コーパス / 方言検索システム / 格助詞 |
研究実績の概要 |
本研究は,日本語諸方言の談話資料を方言コーパスとして整備することにより,コーパスを使った方言分析研究を行うことを主な目的としている。26年度は3年計画の2年目にあたる。具体的な実施内容は以下のとおりである。 (1)方言テキストの整備:前年度に策定した方言テキスト作成の基本方針にしたがい,6地点(弘前市,東京都台東区,石川県羽咋郡押川,大阪市,広島市,北九州市)の談話資料の文字化テキストの点検作業を行なった。また,新たに3地点の方言テキストデータの整備に着手した。 (2)音声データとテキストデータのリンク付け:上記6地点の談話資料を対象として,音声データの時間情報をテキストデータに付与し,音声とテキストのリンク付けを行なった。 (3)検索システムの整備:上記6地点のデータをサンプルとして,検索システムの試作版を作成した。試作版では共通語形から方言形を検索する形でシステムを作成した。すでに公開されている共通語の自動形態素解析ツールを利用することにより,効率的に方言検索システムが構築できるからである。ただし,これによる問題点も明らかとなった。次年度はその対応に当たる。 (4)検索システムを使った研究:検索システムを使って,格助詞の地域差に関する研究を行なった。その結果,弘前市方言では主格,対格ともに格助詞ゼロの例が8割を超えるのに対し,広島市方言では逆に格助詞ゼロの例が1割程度しかないこと,どの方言でも主格に比べて対格の方が,格助詞ゼロの割合が高いこと等が明らかになった。これらの成果は,合同研究発表会「コーパスに見る日本語のバリエーション-会話・方言・学習者・歴史コーパスから-」(国立国語研究所,2014年12月6日),第39回九州方言研究会(熊本大学,2015年1月11日),JLVC2015(国立国語研究所,2015年3月7日)で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
26年度は(1)方言テキストデータベースの整備,(2)方言テキストと音声データとのリンク付け,(3)検索システムの整備,(4)研究打ち合わせ,(5)研究成果の発表,(6)コーパスの公開へ向けての試作,の6項目につき,それぞれ目標を立てて研究を推進した。 (1)については当初,7地点のデータベースの整備を計画していたが,研究協力者の関係で6地点しか実行できなかった。その代わりに,新たに3地点のデータ整備協力者を得て,データの整備を開始した。(2)については,6地点のテキストデータと音声データとのリンク付けの作業が順調に進んだ。(3)については,6地点のデータを対象とする検索システムの試作版を作成し,これを使った研究を行った。(4)については,データ整備方法の問題点を検討するため9月に研究会を開催し,方法の改善を行った。(5)については,研究成果を論文6本,研究発表3件として発表した。(6)については,コーパスの公開へ向けて,合同研究発表会「コーパスに見る日本語のバリエーション-会話・方言・学習者・歴史コーパスから-」を開催し,各種コーパスの開発を行っている研究者と意見交換を行った。
|
今後の研究の推進方策 |
今後の研究の推進方策は,次の2点である。 (1)対象とする方言の数を増やすこと,及び1地点のデータ量を増やすこと。そのためには,方言データの整備に協力してくれる研究協力者を増やす必要がある。26年度は,3回の発表を通じて研究協力を呼びかけ,新たに3地点の協力者を得ることができた。今後も各種研究会や学会を通して,方言コーパス作成の協力者を募っていく。 (2)検索システムの精度を上げること。現在は,共通語から方言形を検索するシステムを採用している。今後,さまざまな検索ができるよう,検索システムの精度を上げていく予定である。また,現在は音声データとのリンクがまだ完成していない。今後,テキストデータと音声データとの関係付けを行っていく。
|
次年度使用額が生じた理由 |
テキストデータの電子入力の作業を委託する計画を立てていたが,作業者の都合により,業務委託の回数を減らさざるを得なくなった。共通語テキストの入力作業と異なり,方言テキストの入力作業には,当該方言に関する知識や作業の経験が必要なため,他に適任者を見つけることが難く,次年度に予算を繰り越し,入力作業を次年度に集中的に行うこととした。
|
次年度使用額の使用計画 |
新たにデータ整備を行うことになった3地点の方言テキストの電子入力謝金として使用する。作業は26年5月から27年3月にかけて行う。
|