研究課題/領域番号 |
26730166
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
図書館情報学・人文社会情報学
|
研究機関 | 立命館大学 |
研究代表者 |
バトジャルガル ビルゲ 立命館大学, 総合科学技術研究機構, 研究員 (30725396)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
研究課題ステータス |
完了 (2016年度)
|
配分額 *注記 |
3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2016年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2015年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2014年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | historical documents / traditional Mongolian / name entity extraction / digital library / machine learning / named entity extraction |
研究成果の概要 |
本研究では、デジタル化した古代モンゴル文字文書の固有表現の抽出方法を提案した。歴史的文書の分析に必要な時間と手間の軽減を目的とし、個人名や地名の固有表現を、サポートベクタマシンを用い抽出した。抽出した固有名詞やその他情報を用い、伝統的モンゴル文字古文書のデジタル版を作った。抽出された固有名詞、解説や字訳は、TEIガイドラインに基づきエンコードを行った。これを基に、デジタル・ヒューマニティーズ研究用Webベースプロトタイプシステムを開発した。本システムでは、伝統的モンゴル文字の原文テキストやそのラテン文字訳を表示・検索可能であり、更にハイライトされた固有表現や原文のスキャン画像を表示可能である。
|