• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

多言語ディジタルアーカイブの統合検索に関する研究

Research Project

Project/Area Number 24500300
Research InstitutionRitsumeikan University

Principal Investigator

前田 亮  立命館大学, 情報理工学部, 教授 (20351322)

Co-Investigator(Kenkyū-buntansha) 木村 文則  立命館大学, 衣笠総合研究機構, 研究員 (70516690)
Keywordsメタデータ / 浮世絵 / レコード同定
Research Abstract

本年度は,本研究課題の目標である多言語ディジタルアーカイブの統合検索の実現に向けて,主に複数データベース間における同一作品を自動的に同定する手法ついて研究を行った.
浮世絵は木版画であるため,同一作品が複数のデータベースに所蔵されていることが多くあるが,メタデータスキーマや記述言語の違いから,同一作品を見つけ出すことは容易ではない.そこで本研究では,メタデータの特定の項目(作品の題名など)を用い,題名の音訳や英訳など,表記や言語が異なる場合であっても同一作品を自動的に見つけ出すための手法を開発した.
具体的には,比較対象のデータベースの全レコードから,まず浮世絵の作者(絵師)のメタデータを用いて同一作者に絞り込みを行う.次に,検索対象の作品名と絞り込み後の対象レコードの作品名の類似度を求め,一定以上の類似度を持つレコードを同一作品と推定する.作品名の類似度の計算は,作品名の表記や言語の違いによって以下のような手法を使い分ける.
1. 同言語・同表記の作品名同士の比較:文字列の比較に良く用いられる編集距離(レーベンシュタイン距離)を用いて類似度を求める.2. 作品名の音訳(ローマ字表記)と英訳の比較:作品名中の固有名詞に着目し,固有名詞の一致数および対訳辞書による訳語一致数を元に類似度を求める.3. 作品の原題と音訳の比較:原題に対し形態素解析器などを用いて読みを抽出し,それをローマ字化したものと音訳を比較する.その際,単語ごとの編集距離および語順の情報を用いて類似度を計算する.
実際に浮世絵の作品名の音訳と英訳に対して提案手法の同定精度の実験を行った結果,MAP(Mean Average Precision)において81.4%の精度が得られた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究課題の目標である多言語ディジタルアーカイブの統合検索の実現に対して,本年度は特に同一作品の同定を中心として研究を進めたが,ほぼ計画通り順調に研究を進めることができた.特に,言語が異なるレコード間において,作品名だけの情報を用いて80%以上の同定精度が得られたことは,大きな成果であると考えている.
なお,研究実施計画に挙げた他のディジタルアーカイブへの拡張に関しては,実際に使用可能なディジタルアーカイブを調査・検討は行ったものの,システムに実装するまでには至らなかった.この点に関しては,今後,必要なデータの入手および具体的な実装手法の検討を行う必要があると考えている.

Strategy for Future Research Activity

今後は,同一作品の同定手法の研究を中心に,対応言語・表記の組み合わせの拡張および同定精度の向上を図る.具体的には,これまで対象としていなかった作品の原題と英訳の組み合わせに対する同定手法を検討する.また,現在は浮世絵のみを同定の対象としているが,それ以外の古典史料に対する提案手法の適用可能性について検討する.
さらに,提案手法の国内外の他の浮世絵ディジタルアーカイブへの対応を行う.これらを対象に加える際には,メタデータ要素をどのようにマッピングするかが問題となる.申請者らは,これまでに人文系ディジタルアーカイブを対象としたメタデータ要素名の文字列類似度に基づいた自動マッピングの研究を行っているが,これを基に発展させ,要素名だけではなくメタデータの記述内容も利用することで,より高精度なマッピングを行う技術を開発する.

Expenditure Plans for the Next FY Research Funding

消耗品として購入を予定していた実験用記憶装置およびソフトウェアを使用しなくても実験を行える見通しとなったため.
次年度使用額は,主に実験データ作成・評価のために雇用するアルバイトへの謝金として使用する計画である.

  • Research Products

    (13 results)

All 2013 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (11 results) (of which Invited: 1 results)

  • [Journal Article] Visualization of relationships among historical persons from Japanese historical documents2013

    • Author(s)
      Fuminori Kimura, Takahiko Osaki, Taro Tezuka, and Akira Maeda
    • Journal Title

      Literary and Linguistic Computing

      Volume: Vol. 28, No. 2 Pages: 271-278

    • DOI

      10.1093/llc/fqs045

    • Peer Reviewed
  • [Journal Article] Linked data driven multilingual access to diverse Japanese Ukiyo-e databases by generating links dynamically2013

    • Author(s)
      Biligsaikhan Batjargal, Takeo Kuyama, Fuminori Kimura, and Akira Maeda
    • Journal Title

      Literary and Linguistic Computing

      Volume: Vol. 28, No. 4 Pages: 522-530

    • DOI

      10.1093/llc/fqt058

    • Peer Reviewed
  • [Presentation] A Linked Data Driven Approach on Cross Language Information Access to Diverse Japanese Databases

    • Author(s)
      Biligsaikhan Batjargal, Takeo Kuyama, Fuminori Kimura, and Akira Maeda
    • Organizer
      5th International Conference on Qualitative and Quantitative Methods in Libraries (QQML2013)
    • Place of Presentation
      Rome, Italy
  • [Presentation] Personal Name Extraction from Ancient Japanese Texts

    • Author(s)
      Mamoru Yoshimura, Fuminori Kimura, and Akira Maeda
    • Organizer
      Exploration, Navigation and Retrieval of Information in Cultural Heritage ENRICH 2013 Workshop
    • Place of Presentation
      Dublin, Ireland
  • [Presentation] Linked Data Driven Dynamic Web Services for Providing Multilingual Access to Diverse Japanese Humanities Databases

    • Author(s)
      Biligsaikhan Batjargal, Takeo Kuyama, Fuminori Kimura, and Akira Maeda
    • Organizer
      13th International Conference on Dublin Core and Metadata Applications (DC-2013)
    • Place of Presentation
      Lisbon, Portugal
  • [Presentation] Applying Text Encoding Initiative Guidelines to a Historical Record in Traditional Mongolian Script

    • Author(s)
      Biligsaikhan Batjargal, Fuminori Kimura, Garmaabazar Khaltarkhuu, and Akira Maeda
    • Organizer
      4th International Conference on Culture and Computing (Culture and Computing 2013)
    • Place of Presentation
      立命館大学朱雀キャンパス(京都府)
  • [Presentation] Extraction of Linked Data Triples from Japanese Wikipedia Text of Ukiyo-e Painters

    • Author(s)
      Fuminori Kimura, Katsuhiro Mitsui, and Akira Maeda
    • Organizer
      4th International Conference on Culture and Computing (Culture and Computing 2013)
    • Place of Presentation
      立命館大学朱雀キャンパス(京都府)
  • [Presentation] Multilingual Access to Diverse Digital Libraries and Archives: A Linked Data Approach

    • Author(s)
      Akira Maeda
    • Organizer
      Fourth International Conference on Digital Libraries (ICDL2013)
    • Place of Presentation
      New Delhi, India
    • Invited
  • [Presentation] 浮世絵を対象とした多言語・異種データベースの横断検索

    • Author(s)
      Biligsaikhan Batjargal, 木村 文則, 前田 亮
    • Organizer
      第19回公開シンポジウム「人文科学とデータベース」
    • Place of Presentation
      立命館大学衣笠キャンパス(京都府)
  • [Presentation] 複数の人文系研究者による史料注釈を可能とするWebシステムの試作―『東大寺要録』を用いて―

    • Author(s)
      佐藤 貴文, 後藤 真, 木村 文則, 前田 亮
    • Organizer
      人文科学とコンピュータシンポジウム
    • Place of Presentation
      京都大学吉田キャンパス(京都府)
  • [Presentation] 古文テキストからの人物表現抽出

    • Author(s)
      吉村 衛, 木村 文則, 前田 亮
    • Organizer
      人文科学とコンピュータシンポジウム
    • Place of Presentation
      京都大学吉田キャンパス(京都府)
  • [Presentation] 複数の異種浮世絵データベース間における同一作品の同定手法の提案

    • Author(s)
      久山 岳夫, Biligsaikhan Batjargal, 木村 文則, 前田 亮
    • Organizer
      人文科学とコンピュータシンポジウム
    • Place of Presentation
      京都大学吉田キャンパス(京都府)
  • [Presentation] メタデータを用いた異言語浮世絵データベース間における同一作品の同定手法

    • Author(s)
      加藤 拓磨, 久山 岳夫, Biligsaikhan Batjargal, 木村 文則, 前田 亮
    • Organizer
      第3回知識・芸術・文化情報学研究会
    • Place of Presentation
      立命館大阪梅田キャンパス(大阪府)

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi