• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

多言語ディジタルアーカイブの統合検索に関する研究

Research Project

Project/Area Number 24500300
Research InstitutionRitsumeikan University

Principal Investigator

前田 亮  立命館大学, 情報理工学部, 教授 (20351322)

Co-Investigator(Kenkyū-buntansha) 木村 文則  立命館大学, 衣笠総合研究機構, 研究員 (70516690)
Project Period (FY) 2012-04-01 – 2016-03-31
Keywordsメタデータ / 浮世絵 / レコード同定
Outline of Annual Research Achievements

本年度は,昨年度に引き続き,本研究課題の目標である多言語ディジタルアーカイブの統合検索の実現に向けて,主に複数データベース間における同一作品を同定する手法について研究を行った.
浮世絵は木版画であるため,同一作品が複数のデータベースに所蔵されていることが多くあるが,メタデータスキーマや記述言語の違いから,異なるデータベースから同一作品を見つけ出すことは容易ではない.そこで本研究では,メタデータの特定の項目(作品の題名など)を用い,題名の音訳や英訳など,表記や言語が異なる場合であっても同一作品を自動的に見つけ出すための手法を開発している.これまでに提案している同定手法は以下の4種類に分類できる.
1. 同言語・同表記の作品名同士の比較:文字列の比較に良く用いられる編集距離(レーベンシュタイン距離)を用いて類似度を求める.2. 作品名の音訳(ローマ字表記)と英訳の比較:作品名中の固有名詞に着目し,固有名詞の一致数および対訳辞書による訳語一致数を基に類似度を求める.3. 作品の原題と音訳の比較:原題に対し形態素解析器を用いて読みを抽出し,それをローマ字化したものと音訳を比較する.その際,単語ごとの編集距離および語順の情報を用いて類似度を計算する.4. 作品の原題と英訳の比較:まず,原題を辞書との最長一致により単語に分割し,逐語訳を行う.その逐語訳と作品名の英訳に対して,固有名詞および一般名詞の一致数を基に類似度を算出する.
今年度は,これまで対象としていなかった作品の原題と英訳を用いた比較手法(上記4)を新たに提案した.本手法について,実際に浮世絵の作品名の原題と英訳に対して提案手法の同定精度の実験を行った結果,約78%の正解率が得られた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究課題の目標である多言語ディジタルアーカイブの統合検索の実現に対して,本年度は昨年度に引き続いて同一作品の同定手法を中心として研究を進め,ほぼ計画通りに研究を進めることができた.特に,本年度に新たに提案した,作品の原題と英訳を用いた比較手法手法により,作品名が同言語・同表記の場合,音訳と英訳の場合,原題と音訳の場合,原題と英訳の場合と,全ての組み合わせに対応できるようになったことは,大きな成果であると考えている.
今後は,現在対象としている浮世絵以外の他のディジタルアーカイブへの対応,日本語と英語以外の他国語への対応を行うことを検討している.

Strategy for Future Research Activity

次年度は,本研究課題の最終年度であり,これまでに研究を進めてきた,メタデータの自動マッピングに基づく人文系ディジタルアーカイブの横断検索技術,Linked Dataを用いた複数データベースの統合利用技術,言語が異なる同一作品の同定技術を統合し,多言語ディジタルアーカイブの統合検索システムを完成させる計画である.また,完成したシステムのインターネット上での公開を検討する.なお,本研究の成果の一部は,立命館大学アート・リサーチセンターにおける所蔵資料の統合検索システムとして使用されることが検討されている.
本研究の最終的な成果は,複数の国内会議および国際会議において発表を行う予定である.また,研究成果をまとめた論文を学術論文誌に投稿することを検討する.

Causes of Carryover

成果発表のための旅費として計上していた金額が,当初の見積もりよりも少額で済むことになったため.

Expenditure Plan for Carryover Budget

次年度使用額は,主に成果発表のための旅費の一部に充てる計画である.

  • Research Products

    (14 results)

All 2016 2015 2014

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (12 results)

  • [Journal Article] Automatic Keyword Extraction for Wikification of East Asian Language Documents2016

    • Author(s)
      Kensuke Horita, Fuminori Kimura, and Akira Maeda
    • Journal Title

      International Journal of Computer Theory and Engineering

      Volume: 8 Pages: 32-35

    • DOI

      10.7763/IJCTE.2016.V8.1015

    • Peer Reviewed / Open Access
  • [Journal Article] Developing a Collaborative Annotation System for Historical Documents by Multiple Humanities Researchers2016

    • Author(s)
      Takafumi Sato, Makoto Goto, Fuminori Kimura, and Akira Maeda
    • Journal Title

      International Journal of Computer Theory and Engineering

      Volume: 8 Pages: 88-93

    • DOI

      10.7763/IJCTE.2016.V8.1025

    • Peer Reviewed / Open Access
  • [Presentation] Finding the Same Artworks from Multiple Databases in Different Languages2015

    • Author(s)
      Taisuke Kimura, Biligsaikhan Batjargal, Fuminori Kimura, and Akira Maeda
    • Organizer
      Digital Humanities 2015
    • Place of Presentation
      Sydney, Australia
    • Year and Date
      2015-07-01 – 2015-07-01
  • [Presentation] Extracting Key Phrases for Suggesting Annotation Candidates from Japanese Historical Document2015

    • Author(s)
      Takafumi Sato, Makoto Goto, Fuminori Kimura, and Akira Maeda
    • Organizer
      Digital Humanities 2015
    • Place of Presentation
      Sydney, Australia
    • Year and Date
      2015-07-01 – 2015-07-01
  • [Presentation] オンライン百科事典を対象とした日中言語間エンティティリンキング手法の提案 -日本語文章中の重要語の翻訳手法-2015

    • Author(s)
      周 佳良, 宋 翔, 堀田 健介, 木村 文則, 前田 亮
    • Organizer
      第77回情報処理学会全国大会
    • Place of Presentation
      京都大学吉田キャンパス(京都府)
    • Year and Date
      2015-03-18 – 2015-03-18
  • [Presentation] オンライン百科事典を対象とした日中言語間エンティティリンキング手法の提案 -適切な用語説明ページの抽出手法-2015

    • Author(s)
      宋 翔, 周 佳良, 堀田 健介, 木村 文則, 前田 亮
    • Organizer
      第77回情報処理学会全国大会
    • Place of Presentation
      京都大学吉田キャンパス(京都府)
    • Year and Date
      2015-03-18 – 2015-03-18
  • [Presentation] 言語が異なる浮世絵データベース間における同一作品の同定手法の提案2015

    • Author(s)
      木村 泰典, Biligsaikhan Batjargal, 木村 文則, 前田 亮
    • Organizer
      第77回情報処理学会全国大会
    • Place of Presentation
      京都大学吉田キャンパス(京都府)
    • Year and Date
      2015-03-17 – 2015-03-17
  • [Presentation] Wikipedia記事の言語間差異抽出手法の提案2015

    • Author(s)
      原田 一慧, 木村 文則, 前田 亮
    • Organizer
      第7回データ工学と情報マネジメントに関するフォーラム(DEIM2015)
    • Place of Presentation
      磐梯熱海ホテル華の湯(福島県)
    • Year and Date
      2015-03-04 – 2015-03-04
  • [Presentation] 役者評判記からの人物に関する表現の自動抽出手法2015

    • Author(s)
      永井 規善, 木村 文則, 前田 亮, 赤間 亮
    • Organizer
      第4回知識・芸術・文化情報学研究会
    • Place of Presentation
      立命館大阪梅田キャンパス(大阪府)
    • Year and Date
      2015-02-07 – 2015-02-07
  • [Presentation] 東大寺要録からの歴史知識情報の抽出 ―注釈情報の共有を目指して―2014

    • Author(s)
      佐藤 貴文, 後藤 真, 木村 文則, 前田 亮
    • Organizer
      人文科学とコンピュータシンポジウム
    • Place of Presentation
      国立情報学研究所(東京都)
    • Year and Date
      2014-12-13 – 2014-12-13
  • [Presentation] 役者評判記からの人物表現抽出手法の提案2014

    • Author(s)
      永井 規善, 前田 亮, 木村 文則, 赤間 亮
    • Organizer
      人文科学とコンピュータシンポジウム
    • Place of Presentation
      国立情報学研究所(東京都)
    • Year and Date
      2014-12-13 – 2014-12-13
  • [Presentation] Identifying the Same Records across multiple Ukiyo-e Image Databases Using Textual Data in Different Languages2014

    • Author(s)
      Biligsaikhan Batjargal, Takeo Kuyama, Fuminori Kimura, and Akira Maeda. Identifying the Same Records across multiple Ukiyo-e Image Databases Using Textual Data in Different Languages
    • Organizer
      ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014)
    • Place of Presentation
      London, U.K.
    • Year and Date
      2014-09-10 – 2014-09-10
  • [Presentation] Method for Supporting Analysis of Personal Relationships through Place Names Extracted from Documents2014

    • Author(s)
      Fuminori Kimura and Akira Maeda
    • Organizer
      ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014)
    • Place of Presentation
      London, U.K.
    • Year and Date
      2014-09-10 – 2014-09-10
  • [Presentation] An Approach to Named Entity Extraction from Historical Documents in Traditional Mongolian Script2014

    • Author(s)
      Biligsaikhan Batjargal, Garmaabazar Khaltarkhuu, Fuminori Kimura, and Akira Maeda
    • Organizer
      ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014)
    • Place of Presentation
      London, U.K.
    • Year and Date
      2014-09-09 – 2014-09-09

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi