• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

多言語ディジタルアーカイブにおける言語横断レコード同定手法の研究

Research Project

Project/Area Number 16K00452
Research InstitutionRitsumeikan University

Principal Investigator

前田 亮  立命館大学, 情報理工学部, 教授 (20351322)

Co-Investigator(Kenkyū-buntansha) バトジャルガル ビルゲ  立命館大学, 総合科学技術研究機構, 研究員 (30725396)
Project Period (FY) 2016-04-01 – 2020-03-31
Keywordsメタデータ / 浮世絵 / レコード同定 / エンティティリンキング
Outline of Annual Research Achievements

本年度は,本研究課題の目標である,世界中に散在するディジタルアーカイブ間の同一実体レコードを自動的に発見し,それらをリンクさせる技術の開発の開発に向けて,主に言語横断レコード同定に関する研究を行った.また,ディジタルアーカイブ内のテキスト中で言及されているエンティティ(実体)から,それを説明する別言語の知識ベースの記事に自動的にリンクする言語横断エンティティリンキングの研究を行った.
同一作品の同定手法に関しては,浮世絵のディジタルアーカイブを対象とし,従来のメタデータの辞書による翻訳および単語レベルのマッチングによる手法に加え,固有名詞の逆翻訳(back transliteration)に基づく手法および,単語の分散表現(word embedding)を用いた意味的マッチングに基づく手法を提案した.実験の結果,固有名詞の逆翻訳および単語の分散表現を用いることにより,従来の単語マッチングに基づく手法と比較して,言語横断レコード同定の精度向上に有効であることを示した.
言語横断エンティティリンキングに関しては,ディジタルアーカイブ内のメタデータなどのテキスト中に記述されているエンティティ(実体)から,それを説明する別言語のディジタルアーカイブのレコードに自動的にリンクすることを目標として,リンク対象となるエンティティを利用者の言語レベルに応じて動的に抽出する手法および,元テキストと説明テキストの類似度に基づくエンティティの曖昧性解消手法を提案した.実験の結果,従来手法と比較して,より適切な言語横断エンティティリンキングが実現可能なことを示した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究課題の目標である,世界中に散在するディジタルアーカイブ間の同一実体レコードを自動的に発見し,それらをリンクさせる技術の開発の開発に向けて,ほぼ計画通りに研究を進めることができた.特に,固有名詞の逆翻訳(back transliteration)に基づく手法および,単語の分散表現(word embedding)を用いた意味的マッチングに基づく手法により,従来の辞書による翻訳と単語のマッチングに基づく手法と比較して,大幅な精度向上を見込める手法を提案できたことは,大きな成果であると考えている.

Strategy for Future Research Activity

次年度は,同一作品の同定手法の研究を中心に,より同定精度を向上させるために,作品名以外のメタデータ要素の利用,単語の分散表現を用いた手法におけるより適切なコーパスや学習モデルの検討を行う.また,現在対象としている浮世絵以外の他のディジタルアーカイブへの対応,日本語と英語以外の他国語への対応を行うことを検討している.本研究の成果は,複数の国内会議および国際会議において発表を行う予定である.また,研究成果をまとめた論文を学術論文誌に投稿する.

Causes of Carryover

成果発表のための旅費として計上していた金額が,当初の見積もりよりも少額で済むことになったため.

Expenditure Plan for Carryover Budget

次年度使用額は,主に成果発表のための旅費の一部に充てる計画である.

  • Research Products

    (9 results)

All 2017 2016

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (8 results) (of which Int'l Joint Research: 6 results,  Invited: 1 results)

  • [Journal Article] A Japanese-Chinese Cross-Language Entity Linking Method with Entity Disambiguation Based on Document Similarity2016

    • Author(s)
      Xiang Song, Jialiang Zhou, Fuminori Kimura, and Akira Maeda
    • Journal Title

      International Journal of Knowledge Engineering

      Volume: 2 Pages: 122-127

    • DOI

      10.18178/ijke.2016.2.3.065

    • Peer Reviewed / Open Access
  • [Presentation] Cross-Language Record Linkage by Exploiting Semantic Matching of Textual Metadata2017

    • Author(s)
      Yuting Song, Taisuke Kimura, Biligsaikhan Batjargal, and Akira Maeda
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      高山グリーンホテル(岐阜県.高山市)
    • Year and Date
      2017-03-08
  • [Presentation] Towards Integrated Multilingual Access to Diverse Digital Libraries and Archives2016

    • Author(s)
      Akira Maeda
    • Organizer
      Fifth International Conference on Digital Libraries (ICDL2016)
    • Place of Presentation
      New Delhi, India
    • Year and Date
      2016-12-15
    • Int'l Joint Research / Invited
  • [Presentation] 異言語の浮世絵データベースにおける描写的作品名に対応した同一作品の同定手法の提案2016

    • Author(s)
      木村 泰典, Yuting Song, Biligsaikhan Batjargal, 木村 文則, 前田 亮
    • Organizer
      人文科学とコンピュータシンポジウム
    • Place of Presentation
      国文学研究資料館(東京都.立川市)
    • Year and Date
      2016-12-11
  • [Presentation] Proper Noun Recognition in Cross-Language Record Linkage by Exploiting Transliterated Words2016

    • Author(s)
      Yuting Song, Taisuke Kimura, Biligsaikhan Batjargal, and Akira Maeda
    • Organizer
      20th International Conference on Asian Language Processing (IALP 2016)
    • Place of Presentation
      Tainan, Taiwan
    • Year and Date
      2016-11-21
    • Int'l Joint Research
  • [Presentation] Cross-Language Record Linkage using Word Embedding driven Metadata Similarity Measurement2016

    • Author(s)
      Yuting Song, Taisuke Kimura, Biligsaikhan Batjargal, and Akira Maeda
    • Organizer
      15th International Semantic Web Conference (ISWC 2016) Posters and Demonstrations Track
    • Place of Presentation
      神戸国際会議場(兵庫県.神戸市)
    • Year and Date
      2016-10-19
    • Int'l Joint Research
  • [Presentation] Named Entity Extraction from digitized texts of Mongolian Historical Documents in Traditional Mongolian Script2016

    • Author(s)
      Biligsaikhan Batjargal, Garmaabazar Khaltarkhuu, and Akira Maeda
    • Organizer
      Digital Humanities 2016
    • Place of Presentation
      Krakow, Poland
    • Year and Date
      2016-07-13
    • Int'l Joint Research
  • [Presentation] Identifying the Same Ukiyo-e Prints from Databases in Dutch and Japanese2016

    • Author(s)
      Taisuke Kimura, Yuting Song, Biligsaikhan Batjargal, Fuminori Kimura, and Akira Maeda
    • Organizer
      Digital Humanities 2016
    • Place of Presentation
      Krakow, Poland
    • Year and Date
      2016-07-13
    • Int'l Joint Research
  • [Presentation] Entity Linking of Artists Names in Japanese Music Articles2016

    • Author(s)
      Tomoaki Urata and Akira Maeda
    • Organizer
      5th International Congress on Advanced Applied Informatics (IIAI AAI 2016)
    • Place of Presentation
      熊本市国際交流会館(熊本県.熊本市)
    • Year and Date
      2016-07-13
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi