• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

和歌用語シソーラスの開発と用語空間記述に関する基礎研究

研究課題

研究課題/領域番号 26370530
研究機関東京工業大学

研究代表者

山元 啓史  東京工業大学, リベラルアーツ研究教育院, 准教授 (30241756)

研究期間 (年度) 2014-04-01 – 2018-03-31
キーワードシソーラス / 空間分析 / 二十一代集 / 和歌データベース / 歌ことば / 歴史言語学 / Word embedding / 古語辞典
研究実績の概要

本研究の目的は、従来の和歌用語のシソーラス八代集対応版を、二十一代集(905年頃-1439年)対応版に拡張することである。代表者はこれまで15年以上の歳月をかけて、和歌用の形態素解析とシソーラス(用語集体系)を開発してきた。形態素解析用の辞書は、25年度までの基盤研究Cで二十一代集対応版が完成している。一方、シソーラス(さまざまな単語の表記を同一視するか、あるいは異なる意味を持つものか、などを判定するための語彙一覧)については、二十一代集には、まだ対応できていない。本研究において、シソーラスの二十一代集対応版を目指すとともに、その開発を通して、和歌を基盤とする534年間におよぶ古代語の用語空間分析(語彙体系変遷)の理論化を試みた。平成28年度では、シソーラスデータ入力と計算方法の検討を継続した。計算方法は、ネットワーク分析で行われるlinkcomm(Ahn et al. 2010)に加え、GoogleのWord2vec (Mikolov, et al.)の方法論を用い、和歌データにおいても、単語間距離を数理として取り扱えることがわかった。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

平成28年度より、東京工業大学は学士課程、大学院課程を合わせた学院設置を行ったため、新設科目の設置、教育組織の変革、シラバスの策定、新課程授業の実施など、これまでにない大きな教育改革を進めてきた。本課題の研究代表者も教育改革を速やかに実施する
ために多くの時間を割いたため、予定の研究発表ができなかった。

今後の研究の推進方策

開発作業の継続と系列比較モデルによる用語空間の分析を行う。できあがった部分のシソーラスを用い、系列比較モデル(山元ら2012)、linkcommモデルを利用して、任意の2時代の比較(差分)がシソーラスによって可能であるかどうか、Word2vecを利用して、機械学習による単語空間の計算が可能かどうかを実験する。
今後、シソーラス開発の評価は、漸近的語彙推定システムによる方法、系列比較モデルによる方法、2段階によって行い、その分析にはネットワーク分析に用いられるコミュニティー発見手法を用い、シソーラスによる辞書開発の方法論を検討していく。

次年度使用額が生じた理由

教育改革初年度にあたり、学内業務が多忙で、論文執筆ができず、学会発表にいけなかったため。

次年度使用額の使用計画

海外国際学会発表、海外への研究レビューを受ける予定。

  • 研究成果

    (1件)

すべて 2016

すべて 雑誌論文 (1件) (うち査読あり 1件)

  • [雑誌論文] Development of the dictionary of poetic Japanese description2016

    • 著者名/発表者名
      Hilofumi Yamamoto, Bor Hodoscek.
    • 雑誌名

      Digital Scholarship in History and the Humanities, the 6th conference of the Japanese Association for Digital Humanities

      巻: 6 ページ: 44-46

    • 査読あり

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi