Research on visualization and information extraction from ancient Mongolian historical documents

Research Project

Project/Area Number	26730166
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Multi-year Fund
Research Field	Library and information science/Humanistic social informatics
Research Institution	Ritsumeikan University
Principal Investigator	Batjargal Biligsaikhan 立命館大学, 総合科学技術研究機構, 研究員 (30725396)
Project Period (FY)	2014-04-01 – 2017-03-31
Project Status	Completed (Fiscal Year 2016)
Budget Amount *help	¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000) Fiscal Year 2016: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000) Fiscal Year 2015: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000) Fiscal Year 2014: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Keywords	historical documents / traditional Mongolian / name entity extraction / digital library / machine learning / named entity extraction
Outline of Final Research Achievements	In this research, we proposed a named entity extraction method for digitized ancient Mongolian documents. Named entities such as personal names and place names were extracted by employing Support Vector Machine that aims to reduce the labor-intensive analysis on historical text. Using the extracted results, we built a digital edition of a Mongolian historical manuscript written in traditional Mongolian script. The Text Encoding Initiative guidelines was adopted to encode the named entities, commentaries and transliterations. A web-based prototype was developed for digital humanities scholarship. The proposed prototype can display and search traditional Mongolian text and its transliteration in Latin letters along with the highlighted named entities and the scanned images of the source manuscript. We believe the proposed system will have a social significance for digging the hidden knowledge from ancient Mongolian historical documents that is not available in modern Mongolian documents.

Report

(4 results)

2016 Annual Research Report Final Research Report ( PDF )
2015 Research-status Report
2014 Research-status Report

Research Products
(23 results)

All 2017 2016 2015 2014 Other

All Journal Article (1 results) Presentation (18 results) (of which Int'l Joint Research: 5 results) Book (1 results) Remarks (3 results)

[Journal Article] Design and Prototype Implementation of a Federated Search System for Multiple Japanese Humanities Databases2016
- Author(s)
  Biligsaikhan Batjargal
- Journal Title
  
  International Journal of Advances in Computer Science and Its Applications
  
  Volume: 6 Pages: 43-47
- Related Report
  2016 Annual Research Report
[Presentation] Cross-Language Record Linkage by Exploiting Semantic Matching of Textual Metadata2017
- Author(s)
  Yuting Song, Taisuke Kimura, Batjargal Biligsaikhan, and Akira Maeda
- Organizer
  第9回データ工学と情報マネジメントに関するフォーラム（DEIM2017）
- Place of Presentation
  高山グリーンホテル (岐阜県高山市)
- Year and Date
  2017-03-07
- Related Report
  2016 Annual Research Report
[Presentation] 異言語の浮世絵データベースにおける描写的作品名に対応した同一作品の同定手法の提案2016
- Author(s)
  木村泰典, Yuting Song, Biligsaikhan Batjargal, 木村文則, 前田亮
- Organizer
  人文科学とコンピュータシンポジウム
- Place of Presentation
  国文学研究資料館 (東京都立川市)
- Year and Date
  2016-12-10
- Related Report
  2016 Annual Research Report
[Presentation] 動画コメントシステムにおける適切なドット絵の推薦手法の提案2016
- Author(s)
  Zhang Chi, Batjargal Biligsaikhan, 前田亮
- Organizer
  第24回インタラクティブシステムとソフトウェアに関するワークショップ（WISS2016）
- Place of Presentation
  長浜ロイヤルホテル (滋賀県長浜市)
- Year and Date
  2016-12-07
- Related Report
  2016 Annual Research Report
[Presentation] Proper Noun Recognition in Cross-Language Record Linkage by Exploiting Transliterated Words2016
- Author(s)
  Yuting Song, Taisuke Kimura, Biligsaikhan Batjargal and Akira Maeda
- Organizer
  The 20th International Conference on Asian Language Processing (IALP 2016)
- Place of Presentation
  National Cheng Kung University (Tainan, Taiwan)
- Year and Date
  2016-11-22
- Related Report
  2016 Annual Research Report
[Presentation] Cross-Language Record Linkage using Word Embedding driven Metadata Similarity Measurement2016
- Author(s)
  Yuting Song, Taisuke Kimura, Biligsaikhan Batjargal and Akira Maeda
- Organizer
  The 15th International Semantic Web Conference (ISWC2016) Posters & Demonstrations Track
- Place of Presentation
  神戸国際展示場 (兵庫県神戸市)
- Year and Date
  2016-10-19
- Related Report
  2016 Annual Research Report
[Presentation] Named Entity Extraction from digitized texts of Mongolian Historical Documents in Traditional Mongolian Script2016
- Author(s)
  Biligsaikhan Batjargal, Garmaabazar Khaltarkhuu, and Akira Maeda
- Organizer
  Digital Humanities 2016
- Place of Presentation
  Auditorium Maximum, The Jagiellonian University (Krakow, Poland)
- Year and Date
  2016-07-13
- Related Report
  2016 Annual Research Report
[Presentation] Identifying the Same Ukiyo-e Prints from Databases in Dutch and Japanese2016
- Author(s)
  Taisuke Kimura, Yuting Song, Biligsaikhan Batjargal, Fuminori Kimura, and Akira Maeda
- Organizer
  Digital Humanities 2016
- Place of Presentation
  Auditorium Maximum, The Jagiellonian University (Krakow, Poland)
- Year and Date
  2016-07-13
- Related Report
  2016 Annual Research Report
[Presentation] An Approach to Build a Proper Noun Dictionary for Record Linkage across Humanities Databases in Different Languages2016
- Author(s)
  Yuting Song, Taisuke Kimura, Biligsaikhan Batjargal, Akira Maeda
- Organizer
  第8回データ工学と情報マネジメントに関するフォーラム（DEIM2016）
- Place of Presentation
  ヒルトン福岡シーホーク, 福岡県福岡市
- Year and Date
  2016-03-01
- Related Report
  2015 Research-status Report
[Presentation] Design and Prototype Implementation of a Federated Search System for Multiple Japanese Humanities Databases2015
- Author(s)
  Biligsaikhan Batjargal
- Organizer
  The Third International Conference on Advances in Computing, Control and Networking - ACCN 2015
- Place of Presentation
  Hotel Lebua at State Tower, Bangkok, Thailand
- Year and Date
  2015-12-28
- Related Report
  2015 Research-status Report
- Int'l Joint Research
[Presentation] 多言語の浮世絵データベース間における同一作品の同定手法の提案2015
- Author(s)
  木村泰典, Biligsaikhan Batjargal, 木村文則, 前田亮
- Organizer
  人文科学とコンピュータシンポジウム「じんもんこん2015」
- Place of Presentation
  同志社大学京田辺校地夢告館, 京都府京田辺市
- Year and Date
  2015-12-20
- Related Report
  2015 Research-status Report
[Presentation] Providing Bilingual Access to Multiple Japanese Humanities Databases: Text Retrieval Using English and Japanese Queries2015
- Author(s)
  Biligsaikhan Batjargal, Akira Maeda, and Ryo Akama
- Organizer
  The 6th International Conference of Digital Archives and Digital Humanities (DADH2015)
- Place of Presentation
  National Taiwan University, Taipei, Taiwan
- Year and Date
  2015-12-01
- Related Report
  2015 Research-status Report
- Int'l Joint Research
[Presentation] Personal Name Extraction from Mongolian Historical Documents Using Machine Learning2015
- Author(s)
  Biligsaikhan Batjargal, Garmaabazar Khaltarkhuu, and Akira Maeda
- Organizer
  The 6th International Conference of Digital Archives and Digital Humanities (DADH2015)
- Place of Presentation
  National Taiwan University, Taipei, Taiwan
- Year and Date
  2015-12-01
- Related Report
  2015 Research-status Report
- Int'l Joint Research
[Presentation] An Approach to Named Entity Extraction from Mongolian Historical Documents2015
- Author(s)
  Biligsaikhan Batjargal, Garmaabazar Khaltarkhuu, and Akira Maeda
- Organizer
  The International Conference on Culture and Computing (Culture and Computing 2015)
- Place of Presentation
  京都大学, 京都府京都市
- Year and Date
  2015-10-20
- Related Report
  2015 Research-status Report
- Int'l Joint Research
[Presentation] Finding the Same Artworks from Multiple Databases in Different Languages2015
- Author(s)
  Taisuke Kimura, Biligsaikhan Batjargal, Fuminori Kimura, and Akira Maeda
- Organizer
  Digital Humanities 2015
- Place of Presentation
  The University of Western Sydney, Sydney, Australia
- Year and Date
  2015-07-01
- Related Report
  2015 Research-status Report
- Int'l Joint Research
[Presentation] 言語が異なる浮世絵データベース間における同一作品の同定手法の提案2015
- Author(s)
  木村泰典, Biligsaikhan Batjargal, 木村文則, 前田亮
- Organizer
  第77回情報処理学会全国大会
- Place of Presentation
  京都大学(京都府)
- Year and Date
  2015-03-18
- Related Report
  2014 Research-status Report
[Presentation] 人文系データベースの共同研究を管理するプラットフォーム構築について2015
- Author(s)
  山路正憲 and Biligsaikhan Batjargal
- Organizer
  第4回知識・芸術・文化情報学研究会
- Place of Presentation
  立命館大学梅田キャンパス(大阪府)
- Year and Date
  2015-02-07
- Related Report
  2014 Research-status Report
[Presentation] Identifying the Same Records across multiple Ukiyo-e Image Databases Using Textual Data in Different Languages2014
- Author(s)
  Biligsaikhan Batjargal, Takeo Kuyama, Fuminori Kimura, and Akira Maeda
- Organizer
  Digital Libraries 2014: ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014) and International Conference on Theory and Practice of Digital Libraries (TPDL 2014)
- Place of Presentation
  London, U.K.
- Year and Date
  2014-09-10
- Related Report
  2014 Research-status Report
[Presentation] An Approach to Named Entity Extraction from Historical Documents in Traditional Mongolian Script2014
- Author(s)
  Biligsaikhan Batjargal, Garmaabazar Khaltarkhuu, Fuminori Kimura, and Akira Maeda
- Organizer
  Digital Libraries 2014: ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014) and International Conference on Theory and Practice of Digital Libraries (TPDL 2014)
- Place of Presentation
  London, U.K.
- Year and Date
  2014-09-09
- Related Report
  2014 Research-status Report
[Book] Providing Bilingual Access to Multiple Japanese Humanities Databases: Text Retrieval Using English and Japanese Queries. In Jieh Hsiang, editor, Digital Humanities: Between Past, Present, and Future2016
- Author(s)
  Biligsaikhan Batjargal, Akira Maeda, and Ryo Akama
- Total Pages
  464
- Publisher
  National Taiwan University Press
- Related Report
  2016 Annual Research Report
[Remarks] 伝統的モンゴル文字文書のディジタル図書館
- URL
  http://www.dl.is.ritsumei.ac.jp/tmsdl/
- Related Report
  2016 Annual Research Report
[Remarks] 日本文化資源データベースの横断検索システム
- URL
  http://www.dl.is.ritsumei.ac.jp/fessu/#lang=ja
- Related Report
  2016 Annual Research Report
[Remarks] 白川文字検索システム
- URL
  http://www.dl.is.ritsumei.ac.jp/Shirakawa/search/
- Related Report
  2016 Annual Research Report

Research on visualization and information extraction from ancient Mongolian historical documents

Principal Investigator

Batjargal Biligsaikhan 立命館大学, 総合科学技術研究機構, 研究員 (30725396)

¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)

Report

Research Products

[Journal Article] Design and Prototype Implementation of a Federated Search System for Multiple Japanese Humanities Databases2016

Author(s)

Journal Title

Related Report

[Presentation] Cross-Language Record Linkage by Exploiting Semantic Matching of Textual Metadata2017

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] 異言語の浮世絵データベースにおける描写的作品名に対応した同一作品の同定手法の提案2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] 動画コメントシステムにおける適切なドット絵の推薦手法の提案2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] Proper Noun Recognition in Cross-Language Record Linkage by Exploiting Transliterated Words2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] Cross-Language Record Linkage using Word Embedding driven Metadata Similarity Measurement2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] Named Entity Extraction from digitized texts of Mongolian Historical Documents in Traditional Mongolian Script2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] Identifying the Same Ukiyo-e Prints from Databases in Dutch and Japanese2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] An Approach to Build a Proper Noun Dictionary for Record Linkage across Humanities Databases in Different Languages2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] Design and Prototype Implementation of a Federated Search System for Multiple Japanese Humanities Databases2015

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] 多言語の浮世絵データベース間における同一作品の同定手法の提案2015

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] Providing Bilingual Access to Multiple Japanese Humanities Databases: Text Retrieval Using English and Japanese Queries2015

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] Personal Name Extraction from Mongolian Historical Documents Using Machine Learning2015

Author(s)

Organizer

Place of Presentation