• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

平安時代における言語リソースの構築に関する研究

研究課題

研究課題/領域番号 25284086
研究機関青山学院大学

研究代表者

近藤 泰弘  青山学院大学, 文学部, 教授 (20126064)

研究期間 (年度) 2013-04-01 – 2018-03-31
キーワード構築主義 / コーパス / 言語リソース / ジェンダー / 位相 / 平安文学 / 源氏物語
研究実績の概要

本年度は、XML形式のコーパスから辞書形式のデータを作成する研究を主に行った。具体的には次のような手順である。まず、XML形式のデータを用意する。

<SUW orthToken="いま" lForm="イマ" lemma="今" lemmaID="2460" kana="イマ" pos="名詞-普通名詞-副詞可能" Form="イマ" pronToken="イマ" wType="和" start="20" end="40" orderID="20" />いま<SUW orthToken="は" lForm="ハ" lemma="は" lemmaID="29321" kana="ハ" pos="助詞-係助詞" Form="ハ" pronToken="ワ" wType="和" start="40" end="50" orderID="30" />

次にこれを次のような辞書形式に変換する。「03伊勢,2482,会い見る,アイミル,動詞-一般,文語上一段-マ行,に、手を折りてあひ見しことをかぞふれば」そして最後に複数の作品をマージして完成する。このような手続きによって、辞書を作ることができる。これに対して、従来のコーパスはそこから様々な形態を生成可能であるが、その中で、インタラクティブなデータベース検索はそのひとつの実現形でしかない。しかし、コーパスは、本来、本文をそのまま読むことも可能であるし、コーパスから単語を取りだして、以上の様な書籍の辞典形式のスタティックな語彙集を作ることも可能である。今回はそのような研究によって、コーパスから言語リソースを抽出するための基礎研究を行った。今回の語彙集(辞典)には、このような言語リソースの構築史研究の補助として、《連想語》を入れたが、これは人工知能的な手法によって計測した上位10語を入れた。内省の働かない古典語において、「連想」を記述するためにはまずこのような方法から始めてみるべきだろう。(例、「鬼」=「戸口」)今回用いた手法はニューラルネットによる分析である。deep learningではないが、今後は、この種のAI的手法を古典語研究に応用すべきである。今回の研究ではその主発点を作ることができた。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

本年度は予定以上に進行することができた。主たる要因は、平安時代語のコーパスのXML形式から、辞書形式に変換するソフトウエアを開発することができたことによる。これを用いることによって、国立国語研究所の日本語歴史コーパスを利用して、平安時代語連想語辞典を作成するめどがたち、国語研究所のワークショップで発表を行った。次年度の最終年度は、これをもとに、平安時代の言語リソースの型についての研究を行うことができるようになり、確実な成果が出せる予定である。

また、連携研究者の近藤みゆきは、言語リソース研究の発展として、LINEスタンプに百人一首を用いるという成果を発表した。これは研究の応用で、社会的な反響を呼ぶことができた。
最後にウェブサイトについては、英文コンテンツを増加し、アクセスも増加している。研究方法を公開するという当初の目的を十分に達していると考えられる。

今後の研究の推進方策

次年度は研究の最終年度となるため、研究の総合まとめとして、平安時代語言語リソース辞典を作成する。具体的には、本年度開発した方法論を用いて、国語研究所の日本語歴史コーパス、特に『源氏物語』を中心に、連想語彙の表を作成し、それと、用例集とを合体させた形で、平安時代にどのような言語のパターンがあったかを明らかにする。

これによって、日本語の古い時代の言語リソースのかなりの像が明らかになる予定であり、それを現代語の語感と対照することによって、歴史的変化についても研究できる予定である。「桜」と言えば「散る」のような言語の型が現代語にもあるが、これは古典語のある時代に構築されたものであり、そのパターンの抽象的なソースが文化的に伝承されているものと考えられる。このソースは「言語リソース」と呼ばれることがある。「縁語」「枕詞」「歌枕」、ジェンダー言語などもその一部である。これらについて、かなり明確な姿が判明すると予想される。

次年度使用額が生じた理由

論文の英語翻訳や研究のまとめに伴う人件費などが時間的な要因で利用できなかったため。これについては、次年度の利用を予定している。また、国際研究の相手先機関の都合で海外出張ができなかったため旅費が利用できなかった。

次年度使用額の使用計画

論文の英語翻訳および研究のまとめのためのデータ入力費用として使う予定である。また、海外との打合せ旅費を使う予定である。

  • 研究成果

    (4件)

すべて 2017 その他

すべて 雑誌論文 (1件) 学会発表 (1件) 備考 (2件)

  • [雑誌論文] コラム-「越える」の意味について2017

    • 著者名/発表者名
      近藤泰弘
    • 雑誌名

      三遠南信地域の「道と越境の歴史文化」に関する通時的研究と社会的還元の試み

      巻: なし ページ: 60-63

  • [学会発表] 古典語コーパスからの語彙集作成について2017

    • 著者名/発表者名
      近藤泰弘
    • 学会等名
      「通時コーパス」シンポジウム2017
    • 発表場所
      国立国語研究所,東京都
    • 年月日
      2017-03-11 – 2017-03-11
  • [備考] Japanese.gr.jp

    • URL

      http://japanese.gr.jp

  • [備考] LINEスタンプ「実女訳(じつじょやく)ひとこと百人一首」

    • URL

      http://www.jissen.ac.jp/society/collaboration/fx/index.html

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi