研究課題/領域番号 |
25770179
|
研究種目 |
若手研究(B)
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
冨士池 優美 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (20510572)
|
研究期間 (年度) |
2013-04-01 – 2015-03-31
|
キーワード | 歌合 / 和漢混淆文 / コーパス / 構造化 |
研究概要 |
1.歌合は序文・歌・判詞・日記等、多様な要素を持ち、かつ、その開催目的や規模等によって様式が異なる。さまざまな様式を持つ歌合に対応するために、中古中世の歌合のあり方を『歌合集』(日本古典文学大系74)等を用いて調査し、その結果に基づき、要素の多様性に注目した電子化方法について検討した。 2.歌合は、和歌、平仮名漢字交じり文といった和文系統と和化漢文といった漢文系統の文体が入り交じった資料である。中でも判詞部分に和文と和化漢文が混在することが問題になる。勅判は和化漢文で判者の判詞は平仮名主体のものもあれば、定型的な表現のみ和化漢文として表記されるものもあり、その入り交じり方は歌合によって様々である。この実態を踏まえ、歌合コーパスとして、和化漢文についても和文と同様の扱いができることを重視して、電子化方法を検討した。具体には、和化漢文部分に返り点が付されている箇所を全て書き下し形式で電子化する、表記が省略された部分の補読、不読文字のタグ付け、漢字表記された助詞・助動詞を仮名に開くといったテキスト整形の方針を立てた。 上記1、2の検討結果について、言語処理学会第20回年次大会にて発表した。 冨士池優美(2014)「中古中世歌合の構造化」『言語処理学会第20回年次大会発表論文集』P.205-208 3.「天徳四年内裏歌合」「六百番歌合」について、電子化及び上記1、2の検討結果に基づくタグ付けを行った。 4.平安初期歌合(「寛平御時后宮歌合」「亭子院女郎花合」「延喜十三年亭子院歌合」)、歌論『俊頼髄脳』(一部)の形態素解析結果の人手修正を通して、形態論情報の整備試行並びに形態素解析辞書「中古和文UniDic」への歌学・歌合に関する用語の登録を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成25年度の研究計画の主要部分である、歌合が持つ要素の多様性に注目した電子化方法及び和化漢文の扱いの検討については、検討結果をまとめて言語処理学会で発表したことによって、有用なフィードバックも得られた。タグ付けについては未整備な部分を少し残しているが、これは形態素解析辞書の充実を予定より先行した結果であり、平成26年度には取り戻すことができると考える。
|
今後の研究の推進方策 |
平成25年度に作成したデータを基に、継続的に作業を行う。 1.歌合の電子化 「六百番歌合」について、引き続きタグの整備を行う。 2.形態論情報の整備 電子化したデータに対して、読み・品詞等の形態論情報を整備する。形態論情報の整備にあたっては、まず電子テキストを基に単語を切り出す形態素解析を行い、解析結果を人手修正するという方法をとる。形態素解析には平安時代の和文系資料を対象とした「中古和文UniDic」を適用する。人手修正作業を通して、形態素解析辞書「中古和文UniDic」に対して、歌学・歌合に関する用語登録といった形でフィードバックする。 3.語彙・文体研究 上記作業を経て歌合コーパスは歌合全体を対象に、形態素に分割し、読みや品詞と云った形態論情報を付与したものに外形的な要素、文体的特徴等を対応づけたものとなり、外形的な要素や文体ごとの語彙表作成が可能になる。形態素解析結果の整備(人手修正)をし、ある程度の精度に達した時点で語彙調査の基礎的な資料として、各品詞の比率、MVR値(動詞に対する形容詞類の割合)、語種(和語・漢語・混種語)の比率等の各指標を求める。これを活用し、歌合の語彙的特徴の記述を試みる。
|