2013 Fiscal Year Annual Research Report
和漢の両系統を統合する平安・鎌倉時代語コーパス構築のための語彙論的研究
Project/Area Number |
24320086
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
田中 牧郎 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (90217076)
|
Co-Investigator(Kenkyū-buntansha) |
小木曽 智信 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)
高田 智和 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・構造研究系, 准教授 (90415612)
山本 真吾 白百合女子大学, 文学部, 教授 (70210531)
藤原 浩史 中央大学, 文学部, 教授 (00219065)
池田 幸恵 長崎大学, 水産・環境科学総合研究科, 准教授 (10315228)
柳原 恵津子 中央大学, 文学部, 准教授 (50401162)
須永 哲矢 昭和女子大学, 人間文化学部, 非常勤講師 (10589584)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 日本語史 / 古代語 / 語彙 / 文体的変異 / コーパス |
Research Abstract |
和漢の両系統を統合できるような平安・鎌倉時代語のコーパスを作成するための基本問題のうち、(1)電子化とタグ付け、(2)形態素解析用の電子化辞書への語彙登録、の2点について、漢文資料と和漢混淆文資料を対象に重点的な研究を行った。それらと並行して、(3)コーパスを活用することで開けてくる平安・鎌倉時代の語彙論的研究の新領域について、試作中のコーパスを用いて研究した。 (1)電子化とタグ付けについては、前年度にコーパス化の当面の対象に定め入力を実施した、『続日本紀宣命』『高山寺本古往来』『法華百座聞書抄』『尾張国解文』等を対象に、異体字処理、返読処理、補読処理、欠字処理などについて、その実態を観察して、電子化の基準を定め、タグセットを考案する研究を発展させた。また、既存の電子テキストを使う『今昔物語集』についても、同様の研究を進め、コーパスとして使用に耐える構造化テキストを構築した。 (2)電子化辞書への語彙登録については、上記の各種資料に、別の研究プロジェクトで作成した、平安時代和文資料用の解析辞書「中古和文UniDic」で形態素解析を施し、「未知語」として出力されるものや、誤解析になるものの登録を進め、和漢混淆文にも形態素解析を実現できる電子化辞書の整備を進めた。 (3)コーパスを活用した語彙論的研究については、コーパス化が先行している『今昔物語集』『宇治拾遺物語』など一部の試作データを用いて、新たに研究領域の開拓に努め、その第一の成果として、文体の異なる同一内容の説話をパラレルコーパスにして、語の対応を分析する研究を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
(1)電子化とタグ付け、(2)電子化辞書への語彙登録、のいずれにおいても、問題点を明確に整理した上で、具体的な作業を進めることができ、資料数点の電子化とタグ付けをほぼ完成させ、それらに形態素解析をかけるための電子化辞書の整備も進んだ。(3)についても、いくつかの論点を定めた上で、パラレルコーパスによる語の対応の研究について成果を論文にまとめることができた。よって、研究の進捗は順調だと言える。
|
Strategy for Future Research Activity |
平成24年度、25年度に選定し、電子化とタグ付けを終え、解析用の電子化辞書への語彙登録を進めた諸資料について、コーパスを完成させ、公開に向けた準備を行う。そられを活用した語彙研究についても、幅広く展開していく。
|
Expenditure Plans for the Next FY Research Funding |
コーパス試作を行う作業について、作業者への謝金を計上していたが、コーパス試作作業にソフトウェアを導入したことで、作業の効率化を図ることができ、謝金が少なくて済んだ。次年度は、試作したコーパスを活用した語彙論研究をより活発に行うことと、研究成果の公開のための学会参加のための経費がかかることが予想されたため、そこに費用を充てることとした。 研究分担者を追加し分担金を配分することで、コーパスを活用した語彙論的研究を、より活性化させる。また、研究成果を発表するために、学会に参加する旅費を、当初予定よりも増額させる。
|
Research Products
(10 results)