本研究では、デジタル化した古代モンゴル文字文書の固有表現の抽出方法を提案した。歴史的文書の分析に必要な時間と手間の軽減を目的とし、個人名や地名の固有表現を、サポートベクタマシンを用い抽出した。抽出した固有名詞やその他情報を用い、伝統的モンゴル文字古文書のデジタル版を作った。抽出された固有名詞、解説や字訳は、TEIガイドラインに基づきエンコードを行った。これを基に、デジタル・ヒューマニティーズ研究用Webベースプロトタイプシステムを開発した。本システムでは、伝統的モンゴル文字の原文テキストやそのラテン文字訳を表示・検索可能であり、更にハイライトされた固有表現や原文のスキャン画像を表示可能である。
|