研究課題/領域番号 |
26370530
|
研究機関 | 東京工業大学 |
研究代表者 |
山元 啓史 東京工業大学, リベラルアーツ研究教育院, 准教授 (30241756)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | シソーラス / 空間分析 / 二十一代集 / 和歌データベース / 歌ことば / 歴史言語学 / Word embedding / 古語辞典 |
研究実績の概要 |
本研究の目的は、従来の和歌用語のシソーラス八代集対応版を、二十一代集(905年頃-1439年)対応版に拡張することである。代表者はこれまで15年以上の歳月をかけて、和歌用の形態素解析とシソーラス(用語集体系)を開発してきた。形態素解析用の辞書は、25年度までの基盤研究Cで二十一代集対応版が完成している。一方、シソーラス(さまざまな単語の表記を同一視するか、あるいは異なる意味を持つものか、などを判定するための語彙一覧)については、二十一代集には、まだ対応できていない。本研究において、シソーラスの二十一代集対応版を目指すとともに、その開発を通して、和歌を基盤とする534年間におよぶ古代語の用語空間分析(語彙体系変遷)の理論化を試みた。平成28年度では、シソーラスデータ入力と計算方法の検討を継続した。計算方法は、ネットワーク分析で行われるlinkcomm(Ahn et al. 2010)に加え、GoogleのWord2vec (Mikolov, et al.)の方法論を用い、和歌データにおいても、単語間距離を数理として取り扱えることがわかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
平成28年度より、東京工業大学は学士課程、大学院課程を合わせた学院設置を行ったため、新設科目の設置、教育組織の変革、シラバスの策定、新課程授業の実施など、これまでにない大きな教育改革を進めてきた。本課題の研究代表者も教育改革を速やかに実施する ために多くの時間を割いたため、予定の研究発表ができなかった。
|
今後の研究の推進方策 |
開発作業の継続と系列比較モデルによる用語空間の分析を行う。できあがった部分のシソーラスを用い、系列比較モデル(山元ら2012)、linkcommモデルを利用して、任意の2時代の比較(差分)がシソーラスによって可能であるかどうか、Word2vecを利用して、機械学習による単語空間の計算が可能かどうかを実験する。 今後、シソーラス開発の評価は、漸近的語彙推定システムによる方法、系列比較モデルによる方法、2段階によって行い、その分析にはネットワーク分析に用いられるコミュニティー発見手法を用い、シソーラスによる辞書開発の方法論を検討していく。
|
次年度使用額が生じた理由 |
教育改革初年度にあたり、学内業務が多忙で、論文執筆ができず、学会発表にいけなかったため。
|
次年度使用額の使用計画 |
海外国際学会発表、海外への研究レビューを受ける予定。
|