• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実施状況報告書

多言語ディジタルアーカイブにおける言語横断レコード同定手法の研究

研究課題

研究課題/領域番号 16K00452
研究機関立命館大学

研究代表者

前田 亮  立命館大学, 情報理工学部, 教授 (20351322)

研究分担者 バトジャルガル ビルゲサイハン  立命館大学, 衣笠総合研究機構, 研究員 (30725396)
研究期間 (年度) 2016-04-01 – 2020-03-31
キーワードメタデータ / 浮世絵 / レコード同定
研究実績の概要

本年度は,本研究課題の目標である,世界中に散在するディジタルアーカイブ間の同一実体レコードを自動的に発見し,それらをリンクさせる技術の開発に向けて,前年度に引き続き,主に言語横断レコード同定に関する研究を行った.浮世絵のディジタルアーカイブを対象とし,これまでに研究を進めてきた固有名詞の逆翻訳(back transliteration)に基づく手法および,単語の分散表現(word embedding)を用いた単言語の意味的マッチングに基づく2種類の手法に加え,言語横断型の単語分散表現を用いることにより,機械翻訳に依存せずに異言語間でのメタデータの類似度を計算し,これを用いて異言語の浮世絵データベースから同一作品を同定する手法を新たに提案し,これまでに提案した機械翻訳および単言語の単語分散表現を用いる手法と同等の性能が得られることを示した.本手法について,第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019)で発表を行った.また,機械翻訳および単言語の単語分散表現を用いる手法について,日本データベース学会英文論文誌に論文が掲載された.なお,対象とする浮世絵データセットについて,これまでの日本語および英語に加え,オランダ語のデータセットを構築した.今後は,このデータセットを用いて,これまで提案した3種類の言語横断レコード同定手法について,3言語間でのレコード同定の実験を行い,実用的な精度が得られるかどうかについて検証を行う予定である.

現在までの達成度
現在までの達成度

2: おおむね順調に進展している

理由

本研究課題の目標である,世界中に散在するディジタルアーカイブ間の同一実体レコードを自動的に発見し,それらをリンクさせる技術の開発に向けて,ほぼ計画通りに研究を進めることができた.特に,言語横断型の単語分散表現を用いることにより,機械翻訳に依存せずに異言語間でのメタデータの類似度を計算し,これを用いて異言語の浮世絵データベースから同一作品を同定する新たな手法により,これまでの固有名詞の逆翻訳に基づく手法と比較して精度向上を見込め,かつ単言語の単語分散表現を用いる手法と同等の精度を,機械翻訳に依存せずに実現する手法を提案することができた.また,これまでの日本語と英語に加え,オランダ語のデータセットを構築することで,今後の実験において3言語間での言語横断レコード同定の精度を検証するための環境を構築することができた.

今後の研究の推進方策

次年度は,同一作品の同定手法の研究を中心に,より同定精度を向上させるために,刊行年などの作品名以外のメタデータ要素の利用,単語の分散表現を用いた手法におけるより適切なコーパスや学習モデルの検討を行う.特に,作品名中に現れる人名・地名などのエンティティに着目し,同一作品レコードだけでなく,関連する作品の発見に繋がる新たな手法を検討する.また,現在対象としている浮世絵以外の他のディジタルアーカイブへの対応を行うことを検討している.本研究の成果は,複数の国内会議および国際会議において発表を行う予定である.また,研究成果をまとめた論文を学術論文誌に投稿する.

次年度使用額が生じた理由

(理由)
成果発表のための旅費として計上していた金額が,当初の見積もりよりも少額で済むことになったため.
(使用計画)
次年度使用額は,主に研究補助のアルバイト謝金に充てる計画である.

  • 研究成果

    (11件)

すべて 2019 2018

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (10件) (うち国際学会 4件、 招待講演 1件)

  • [雑誌論文] Cross-Language Record Linkage based on Semantic Matching of Metadata2019

    • 著者名/発表者名
      Yuting Song, Biligsaikhan Batjargal, and Akira Maeda
    • 雑誌名

      日本データベース学会英文論文誌

      巻: 17 ページ: 1-8

    • 査読あり / オープンアクセス
  • [学会発表] Metadata Similarity Calculation in Cross-Language Record Linkage based on Cross-lingual Embedding Models2019

    • 著者名/発表者名
      Song Yuting, Batjargal Biligsaikhan, 前田 亮
    • 学会等名
      第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019)
  • [学会発表] 古代文字検索のためのフォントからの字形特徴量の抽出および活用可能性の検討2019

    • 著者名/発表者名
      Li Kangying, Batjargal Biligsaikhan, 前田 亮
    • 学会等名
      第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019)
  • [学会発表] 浮世絵ディジタルアーカイブのための分散表現による作品の関連性に基づいた推薦システム2019

    • 著者名/発表者名
      王 嘉韻, Batjargal Biligsaikhan, 前田 亮, 川越 恭二
    • 学会等名
      第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019)
  • [学会発表] 日本文化資源デジタルアーカイブへの多言語情報アクセス技術2019

    • 著者名/発表者名
      前田 亮
    • 学会等名
      「アジア芸術学」の創成 国際ワークショップ/ 東アジア文化研究のフロンティア
  • [学会発表] Creating A Digital Edition Of Ancient Mongolian Historical Documents2018

    • 著者名/発表者名
      Biligsaikhan Batjargal, Garmaabazar Khaltarkhuu, and Akira Maeda
    • 学会等名
      Digital Humanities 2018
    • 国際学会
  • [学会発表] Ownership Stamp Character Recognition System Based on Ancient Character Typeface2018

    • 著者名/発表者名
      Kangying Li, Biligsaikhan Batjargal, and Akira Maeda
    • 学会等名
      20th International Conference on Asia-Pacific Digital Libraries (ICADL2018)
    • 国際学会
  • [学会発表] A Recommender System in Ukiyo-e Digital Archive for Japanese Art Novices2018

    • 著者名/発表者名
      Jiayun Wang, Biligsaikhan Batjargal, Akira Maeda, and Kyoji Kawagoe
    • 学会等名
      20th International Conference on Asia-Pacific Digital Libraries (ICADL2018)
    • 国際学会
  • [学会発表] 古代文字フォント字形の特徴抽出に基づく蔵書印の検索支援2018

    • 著者名/発表者名
      李 康穎, Batjargal Biligsaikhan, 前田 亮
    • 学会等名
      人文科学とコンピュータシンポジウム
  • [学会発表] 古代文字のディジタル化とその活用の可能性2018

    • 著者名/発表者名
      前田 亮, バトジャルガル ビルゲサイハン, 李 康穎
    • 学会等名
      第五十一回 日本古文書学会大会
  • [学会発表] Management of Digital Database of Cultural Heritage2018

    • 著者名/発表者名
      Akira Maeda
    • 学会等名
      TOR Seminar and Workshop "Teknologi Digital Dalam Pengelolaan Warisan Budaya"
    • 国際学会 / 招待講演

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi