研究課題/領域番号 |
23320095
|
研究機関 | 信州大学 |
研究代表者 |
沢木 幹栄 信州大学, 人文学部, 教授 (20110116)
|
研究分担者 |
中島 由美 一橋大学, 社会(科)学研究科, 教授 (20155732)
菊池 聡 信州大学, 人文学部, 准教授 (30262679)
福嶋 秩子 新潟県立大学, 国際地域学部, 教授 (80189935)
|
研究期間 (年度) |
2011-04-01 – 2014-03-31
|
キーワード | 琉球方言 / XML言語 / 電子化 / 徳之島 / コーパス |
研究概要 |
『徳之島方言2000文辞典』の徳之島方言テキストのすべての文を語に分解し、XML言語の書式で情報付けを行った。すべての語は品詞に分類されるが、その品詞のグループのなかで識別番号が与えられる。また、活用形にも番号が与えられる。徳之島方言は助詞も複数の形態をとるので、その形態にあわせた番号が必要である。語に対する情報として品詞番号、活用形番号、識別番号を付加した。このような詳細な情報を持ったコーパスは日本語の方言ではおそらく初めてのものである。また、このコーパスを利用するためのプログラムも作成した。 このコーパスを作成する過程で、あらたにいくつかの助詞を発見し、動詞の活用についても新たな知見を得ることができた。 このコーパスからは今まで知ることができなかった徳之島方言の構文に関する情報を得ることができる。助詞の連接については2000文の範囲ではあるが、すべての例を拾い出すことができた。また、徳之島方言では名詞などで短母音の語形と長母音の語形があり、どちらを使うかの条件が不明であったが、このコーパスデータがその解明に役立つことが期待される。また、完成されたテキストを分解したのだが、逆に素材としての語を組み合わせてテキストに復元することも可能であり、新たな徳之島文を生成する実験もこのコーパスデータとプログラムから行うことができる。 このコーパスデータをもとに『徳之島方言辞典 基礎データ』を報告書として作成することができた。
|
現在までの達成度 (区分) |
理由
25年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
25年度が最終年度であるため、記入しない。
|