• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

多言語ディジタルアーカイブの統合検索に関する研究

研究課題

研究課題/領域番号 24500300
研究機関立命館大学

研究代表者

前田 亮  立命館大学, 情報理工学部, 教授 (20351322)

研究分担者 木村 文則  立命館大学, 衣笠総合研究機構, 研究員 (70516690)
キーワードメタデータ / 浮世絵 / レコード同定
研究概要

本年度は,本研究課題の目標である多言語ディジタルアーカイブの統合検索の実現に向けて,主に複数データベース間における同一作品を自動的に同定する手法ついて研究を行った.
浮世絵は木版画であるため,同一作品が複数のデータベースに所蔵されていることが多くあるが,メタデータスキーマや記述言語の違いから,同一作品を見つけ出すことは容易ではない.そこで本研究では,メタデータの特定の項目(作品の題名など)を用い,題名の音訳や英訳など,表記や言語が異なる場合であっても同一作品を自動的に見つけ出すための手法を開発した.
具体的には,比較対象のデータベースの全レコードから,まず浮世絵の作者(絵師)のメタデータを用いて同一作者に絞り込みを行う.次に,検索対象の作品名と絞り込み後の対象レコードの作品名の類似度を求め,一定以上の類似度を持つレコードを同一作品と推定する.作品名の類似度の計算は,作品名の表記や言語の違いによって以下のような手法を使い分ける.
1. 同言語・同表記の作品名同士の比較:文字列の比較に良く用いられる編集距離(レーベンシュタイン距離)を用いて類似度を求める.2. 作品名の音訳(ローマ字表記)と英訳の比較:作品名中の固有名詞に着目し,固有名詞の一致数および対訳辞書による訳語一致数を元に類似度を求める.3. 作品の原題と音訳の比較:原題に対し形態素解析器などを用いて読みを抽出し,それをローマ字化したものと音訳を比較する.その際,単語ごとの編集距離および語順の情報を用いて類似度を計算する.
実際に浮世絵の作品名の音訳と英訳に対して提案手法の同定精度の実験を行った結果,MAP(Mean Average Precision)において81.4%の精度が得られた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究課題の目標である多言語ディジタルアーカイブの統合検索の実現に対して,本年度は特に同一作品の同定を中心として研究を進めたが,ほぼ計画通り順調に研究を進めることができた.特に,言語が異なるレコード間において,作品名だけの情報を用いて80%以上の同定精度が得られたことは,大きな成果であると考えている.
なお,研究実施計画に挙げた他のディジタルアーカイブへの拡張に関しては,実際に使用可能なディジタルアーカイブを調査・検討は行ったものの,システムに実装するまでには至らなかった.この点に関しては,今後,必要なデータの入手および具体的な実装手法の検討を行う必要があると考えている.

今後の研究の推進方策

今後は,同一作品の同定手法の研究を中心に,対応言語・表記の組み合わせの拡張および同定精度の向上を図る.具体的には,これまで対象としていなかった作品の原題と英訳の組み合わせに対する同定手法を検討する.また,現在は浮世絵のみを同定の対象としているが,それ以外の古典史料に対する提案手法の適用可能性について検討する.
さらに,提案手法の国内外の他の浮世絵ディジタルアーカイブへの対応を行う.これらを対象に加える際には,メタデータ要素をどのようにマッピングするかが問題となる.申請者らは,これまでに人文系ディジタルアーカイブを対象としたメタデータ要素名の文字列類似度に基づいた自動マッピングの研究を行っているが,これを基に発展させ,要素名だけではなくメタデータの記述内容も利用することで,より高精度なマッピングを行う技術を開発する.

次年度の研究費の使用計画

消耗品として購入を予定していた実験用記憶装置およびソフトウェアを使用しなくても実験を行える見通しとなったため.
次年度使用額は,主に実験データ作成・評価のために雇用するアルバイトへの謝金として使用する計画である.

  • 研究成果

    (13件)

すべて 2013 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (11件) (うち招待講演 1件)

  • [雑誌論文] Visualization of relationships among historical persons from Japanese historical documents2013

    • 著者名/発表者名
      Fuminori Kimura, Takahiko Osaki, Taro Tezuka, and Akira Maeda
    • 雑誌名

      Literary and Linguistic Computing

      巻: Vol. 28, No. 2 ページ: 271-278

    • DOI

      10.1093/llc/fqs045

    • 査読あり
  • [雑誌論文] Linked data driven multilingual access to diverse Japanese Ukiyo-e databases by generating links dynamically2013

    • 著者名/発表者名
      Biligsaikhan Batjargal, Takeo Kuyama, Fuminori Kimura, and Akira Maeda
    • 雑誌名

      Literary and Linguistic Computing

      巻: Vol. 28, No. 4 ページ: 522-530

    • DOI

      10.1093/llc/fqt058

    • 査読あり
  • [学会発表] A Linked Data Driven Approach on Cross Language Information Access to Diverse Japanese Databases

    • 著者名/発表者名
      Biligsaikhan Batjargal, Takeo Kuyama, Fuminori Kimura, and Akira Maeda
    • 学会等名
      5th International Conference on Qualitative and Quantitative Methods in Libraries (QQML2013)
    • 発表場所
      Rome, Italy
  • [学会発表] Personal Name Extraction from Ancient Japanese Texts

    • 著者名/発表者名
      Mamoru Yoshimura, Fuminori Kimura, and Akira Maeda
    • 学会等名
      Exploration, Navigation and Retrieval of Information in Cultural Heritage ENRICH 2013 Workshop
    • 発表場所
      Dublin, Ireland
  • [学会発表] Linked Data Driven Dynamic Web Services for Providing Multilingual Access to Diverse Japanese Humanities Databases

    • 著者名/発表者名
      Biligsaikhan Batjargal, Takeo Kuyama, Fuminori Kimura, and Akira Maeda
    • 学会等名
      13th International Conference on Dublin Core and Metadata Applications (DC-2013)
    • 発表場所
      Lisbon, Portugal
  • [学会発表] Applying Text Encoding Initiative Guidelines to a Historical Record in Traditional Mongolian Script

    • 著者名/発表者名
      Biligsaikhan Batjargal, Fuminori Kimura, Garmaabazar Khaltarkhuu, and Akira Maeda
    • 学会等名
      4th International Conference on Culture and Computing (Culture and Computing 2013)
    • 発表場所
      立命館大学朱雀キャンパス(京都府)
  • [学会発表] Extraction of Linked Data Triples from Japanese Wikipedia Text of Ukiyo-e Painters

    • 著者名/発表者名
      Fuminori Kimura, Katsuhiro Mitsui, and Akira Maeda
    • 学会等名
      4th International Conference on Culture and Computing (Culture and Computing 2013)
    • 発表場所
      立命館大学朱雀キャンパス(京都府)
  • [学会発表] Multilingual Access to Diverse Digital Libraries and Archives: A Linked Data Approach

    • 著者名/発表者名
      Akira Maeda
    • 学会等名
      Fourth International Conference on Digital Libraries (ICDL2013)
    • 発表場所
      New Delhi, India
    • 招待講演
  • [学会発表] 浮世絵を対象とした多言語・異種データベースの横断検索

    • 著者名/発表者名
      Biligsaikhan Batjargal, 木村 文則, 前田 亮
    • 学会等名
      第19回公開シンポジウム「人文科学とデータベース」
    • 発表場所
      立命館大学衣笠キャンパス(京都府)
  • [学会発表] 複数の人文系研究者による史料注釈を可能とするWebシステムの試作―『東大寺要録』を用いて―

    • 著者名/発表者名
      佐藤 貴文, 後藤 真, 木村 文則, 前田 亮
    • 学会等名
      人文科学とコンピュータシンポジウム
    • 発表場所
      京都大学吉田キャンパス(京都府)
  • [学会発表] 古文テキストからの人物表現抽出

    • 著者名/発表者名
      吉村 衛, 木村 文則, 前田 亮
    • 学会等名
      人文科学とコンピュータシンポジウム
    • 発表場所
      京都大学吉田キャンパス(京都府)
  • [学会発表] 複数の異種浮世絵データベース間における同一作品の同定手法の提案

    • 著者名/発表者名
      久山 岳夫, Biligsaikhan Batjargal, 木村 文則, 前田 亮
    • 学会等名
      人文科学とコンピュータシンポジウム
    • 発表場所
      京都大学吉田キャンパス(京都府)
  • [学会発表] メタデータを用いた異言語浮世絵データベース間における同一作品の同定手法

    • 著者名/発表者名
      加藤 拓磨, 久山 岳夫, Biligsaikhan Batjargal, 木村 文則, 前田 亮
    • 学会等名
      第3回知識・芸術・文化情報学研究会
    • 発表場所
      立命館大阪梅田キャンパス(大阪府)

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi