• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

多言語ディジタルアーカイブにおける言語横断レコード同定手法の研究

研究課題

研究課題/領域番号 16K00452
研究機関立命館大学

研究代表者

前田 亮  立命館大学, 情報理工学部, 教授 (20351322)

研究分担者 バトジャルガル ビルゲ  立命館大学, 総合科学技術研究機構, 研究員 (30725396)
研究期間 (年度) 2016-04-01 – 2020-03-31
キーワードメタデータ / 浮世絵 / レコード同定 / エンティティリンキング
研究実績の概要

本年度は,本研究課題の目標である,世界中に散在するディジタルアーカイブ間の同一実体レコードを自動的に発見し,それらをリンクさせる技術の開発の開発に向けて,主に言語横断レコード同定に関する研究を行った.また,ディジタルアーカイブ内のテキスト中で言及されているエンティティ(実体)から,それを説明する別言語の知識ベースの記事に自動的にリンクする言語横断エンティティリンキングの研究を行った.同一作品の同定手法に関しては,浮世絵のディジタルアーカイブを対象とし,これまでに研究を進めてきた固有名詞の逆翻訳(back transliteration)に基づく手法および,単語の分散表現(word embedding)を用いた同一言語および異なる言語の意味的マッチングに基づく2種類の手法を提案した.また,実験に用いるデータについて,より現実の状況に近い実験が行えるように大規模なデータセットを構築した.提案手法の評価実験の結果,単語の分散表現を用いることにより,これまでの固有名詞の逆翻訳に基づく手法と比較して,言語横断レコード同定の精度向上に有効であることを示した.言語横断エンティティリンキングに関しては,ディジタルアーカイブ内のメタデータなどのテキスト中に記述されているエンティティ(実体)から,それを説明する別言語のディジタルアーカイブのレコードに自動的にリンクすることを目標として,昨年度から引き続き,リンク対象となるエンティティを利用者の言語レベルに応じて動的に抽出する手法および,元テキストと説明テキストの類似度に基づくエンティティの曖昧性解消手法の研究を進めた.実験の結果,従来手法と比較して,より適切な言語横断エンティティリンキングが実現可能なことを示 した.

現在までの達成度
現在までの達成度

2: おおむね順調に進展している

理由

本研究課題の目標である,世界中に散在するディジタルアーカイブ間の同一実体レコードを自動的に発見し,それらをリンクさせる技術の開発の開発に向けて,ほぼ計画通りに研究を進めることができた.特に,単語の分散表現(word embedding)を用いた同一言語および異なる言語の意味的マッチングに基づく2種類の提案手法により,これまでの固有名詞の逆翻訳に基づく手法と比較して,精度向上を見込める手法を提案することができた.また,より現実の状況に近い大規模なデータセットを構築することで,今後の実験において信頼性の高い結果を得るための環境を構築することができた.

今後の研究の推進方策

次年度は,同一作品の同定手法の研究を中心に,より同定精度を向上させるために,作者名やシリーズ名などの作品名以外のメタデータ要素の利用,単語の分散表現を用いた手法におけるより適切なコーパスや学習モデルの検討を行う.また,現在対象としている浮世絵以外の他のディジタルアーカイブへの対応,日本語と英語以外の他国語への対応を行うことを検討している.本研究の成果は,複数の国内会議および国際会議において発表を行う予定である.また,研究成果をまとめた論文を学術論文誌に投稿する.

次年度使用額が生じた理由

(理由)
成果発表のための旅費として計上していた金額が,当初の見積もりよりも少額で済むことになったため.
(使用計画)
次年度使用額は,主に成果発表のための旅費の一部に充てる計画である.

  • 研究成果

    (9件)

すべて 2018 2017

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (7件) (うち国際学会 4件) 図書 (1件)

  • [雑誌論文] Recognition and Transliteration of Proper Nouns in Cross-Language Record Linkage by Constructing Transliterated Word Pairs2017

    • 著者名/発表者名
      Yuting Song, Biligsaikhan Batjargal, and Akira Maeda
    • 雑誌名

      International Journal of Asian Language Processing

      巻: 27 ページ: 111-125

    • 査読あり / オープンアクセス
  • [学会発表] An Entity Disambiguation Approach Based on Wikipedia and Word Embeddings for Entity Linking in Microblogs2018

    • 著者名/発表者名
      Tomoaki Urata and Akira Maeda
    • 学会等名
      International MultiConference of Engineers and Computer Scientists 2018 (IMECS2018)
    • 国際学会
  • [学会発表] マイクロブログを対象にしたエンティティリンキングにおける語義曖昧性解消2018

    • 著者名/発表者名
      浦田 智昭, 前田 亮
    • 学会等名
      第10回データ工学と情報マネジメントに関するフォーラム(DEIM2018)
  • [学会発表] An Entity Disambiguation Approach Based on Wikipedia for Entity Linking in Microblogs2017

    • 著者名/発表者名
      Tomoaki Urata and Akira Maeda
    • 学会等名
      6th International Congress on Advanced Applied Informatics (IIAI AAI 2017)
    • 国際学会
  • [学会発表] Linking the Same Ukiyo-e Prints in Different Languages by Exploiting Word Semantic Relationships across Languages2017

    • 著者名/発表者名
      Yuting Song, Taisuke Kimura, Biligsaikhan Batjargal, and Akira Maeda
    • 学会等名
      Digital Humanities 2017
    • 国際学会
  • [学会発表] Creating a Digital Edition of Mongolian Historical Documents2017

    • 著者名/発表者名
      Biligsaikhan Batjargal, Garmaabazar Khaltarkhuu, and Akira Maeda
    • 学会等名
      International Conference on Culture and Computing (Culture and Computing 2017)
    • 国際学会
  • [学会発表] 複数言語からなるデジタルコレクションからの同一浮世絵作品の同定手法2017

    • 著者名/発表者名
      Song Yuting, Batjargal Biligsaikhan, 前田 亮
    • 学会等名
      第8回横幹連合コンファレンス
  • [学会発表] 日本の人文系データベースへのバイリンガル並列アクセスの実現 -横断検索システムの開発-2017

    • 著者名/発表者名
      バトジャルガル ビルゲサイハン, 前田 亮
    • 学会等名
      第8回横幹連合コンファレンス
  • [図書] Japanese-Chinese Cross-Language Entity Linking Adapting to User's Language Ability (In Sio-Iong Ao, Haeng Kon Kim, Oscar Castillo, Alan Hoi-Shou Chan, and Hideki Katagiri, editors, Transactions on Engineering Technologies, chapter 28, pp.383-397)2018

    • 著者名/発表者名
      Fuminori Kimura, Jialiang Zhou, and Akira Maeda
    • 総ページ数
      397
    • 出版者
      Springer Singapore
    • ISBN
      978-981-10-7488-2

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi