• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

多言語ディジタルアーカイブの統合検索に関する研究

研究課題

研究課題/領域番号 24500300
研究機関立命館大学

研究代表者

前田 亮  立命館大学, 情報理工学部, 教授 (20351322)

研究分担者 木村 文則  立命館大学, 衣笠総合研究機構, 研究員 (70516690)
研究期間 (年度) 2012-04-01 – 2016-03-31
キーワードメタデータ / 浮世絵 / レコード同定
研究実績の概要

本年度は,昨年度に引き続き,本研究課題の目標である多言語ディジタルアーカイブの統合検索の実現に向けて,主に複数データベース間における同一作品を同定する手法について研究を行った.
浮世絵は木版画であるため,同一作品が複数のデータベースに所蔵されていることが多くあるが,メタデータスキーマや記述言語の違いから,異なるデータベースから同一作品を見つけ出すことは容易ではない.そこで本研究では,メタデータの特定の項目(作品の題名など)を用い,題名の音訳や英訳など,表記や言語が異なる場合であっても同一作品を自動的に見つけ出すための手法を開発している.これまでに提案している同定手法は以下の4種類に分類できる.
1. 同言語・同表記の作品名同士の比較:文字列の比較に良く用いられる編集距離(レーベンシュタイン距離)を用いて類似度を求める.2. 作品名の音訳(ローマ字表記)と英訳の比較:作品名中の固有名詞に着目し,固有名詞の一致数および対訳辞書による訳語一致数を基に類似度を求める.3. 作品の原題と音訳の比較:原題に対し形態素解析器を用いて読みを抽出し,それをローマ字化したものと音訳を比較する.その際,単語ごとの編集距離および語順の情報を用いて類似度を計算する.4. 作品の原題と英訳の比較:まず,原題を辞書との最長一致により単語に分割し,逐語訳を行う.その逐語訳と作品名の英訳に対して,固有名詞および一般名詞の一致数を基に類似度を算出する.
今年度は,これまで対象としていなかった作品の原題と英訳を用いた比較手法(上記4)を新たに提案した.本手法について,実際に浮世絵の作品名の原題と英訳に対して提案手法の同定精度の実験を行った結果,約78%の正解率が得られた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究課題の目標である多言語ディジタルアーカイブの統合検索の実現に対して,本年度は昨年度に引き続いて同一作品の同定手法を中心として研究を進め,ほぼ計画通りに研究を進めることができた.特に,本年度に新たに提案した,作品の原題と英訳を用いた比較手法手法により,作品名が同言語・同表記の場合,音訳と英訳の場合,原題と音訳の場合,原題と英訳の場合と,全ての組み合わせに対応できるようになったことは,大きな成果であると考えている.
今後は,現在対象としている浮世絵以外の他のディジタルアーカイブへの対応,日本語と英語以外の他国語への対応を行うことを検討している.

今後の研究の推進方策

次年度は,本研究課題の最終年度であり,これまでに研究を進めてきた,メタデータの自動マッピングに基づく人文系ディジタルアーカイブの横断検索技術,Linked Dataを用いた複数データベースの統合利用技術,言語が異なる同一作品の同定技術を統合し,多言語ディジタルアーカイブの統合検索システムを完成させる計画である.また,完成したシステムのインターネット上での公開を検討する.なお,本研究の成果の一部は,立命館大学アート・リサーチセンターにおける所蔵資料の統合検索システムとして使用されることが検討されている.
本研究の最終的な成果は,複数の国内会議および国際会議において発表を行う予定である.また,研究成果をまとめた論文を学術論文誌に投稿することを検討する.

次年度使用額が生じた理由

成果発表のための旅費として計上していた金額が,当初の見積もりよりも少額で済むことになったため.

次年度使用額の使用計画

次年度使用額は,主に成果発表のための旅費の一部に充てる計画である.

  • 研究成果

    (14件)

すべて 2016 2015 2014

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (12件)

  • [雑誌論文] Automatic Keyword Extraction for Wikification of East Asian Language Documents2016

    • 著者名/発表者名
      Kensuke Horita, Fuminori Kimura, and Akira Maeda
    • 雑誌名

      International Journal of Computer Theory and Engineering

      巻: 8 ページ: 32-35

    • DOI

      10.7763/IJCTE.2016.V8.1015

    • 査読あり / オープンアクセス
  • [雑誌論文] Developing a Collaborative Annotation System for Historical Documents by Multiple Humanities Researchers2016

    • 著者名/発表者名
      Takafumi Sato, Makoto Goto, Fuminori Kimura, and Akira Maeda
    • 雑誌名

      International Journal of Computer Theory and Engineering

      巻: 8 ページ: 88-93

    • DOI

      10.7763/IJCTE.2016.V8.1025

    • 査読あり / オープンアクセス
  • [学会発表] Finding the Same Artworks from Multiple Databases in Different Languages2015

    • 著者名/発表者名
      Taisuke Kimura, Biligsaikhan Batjargal, Fuminori Kimura, and Akira Maeda
    • 学会等名
      Digital Humanities 2015
    • 発表場所
      Sydney, Australia
    • 年月日
      2015-07-01 – 2015-07-01
  • [学会発表] Extracting Key Phrases for Suggesting Annotation Candidates from Japanese Historical Document2015

    • 著者名/発表者名
      Takafumi Sato, Makoto Goto, Fuminori Kimura, and Akira Maeda
    • 学会等名
      Digital Humanities 2015
    • 発表場所
      Sydney, Australia
    • 年月日
      2015-07-01 – 2015-07-01
  • [学会発表] オンライン百科事典を対象とした日中言語間エンティティリンキング手法の提案 -日本語文章中の重要語の翻訳手法-2015

    • 著者名/発表者名
      周 佳良, 宋 翔, 堀田 健介, 木村 文則, 前田 亮
    • 学会等名
      第77回情報処理学会全国大会
    • 発表場所
      京都大学吉田キャンパス(京都府)
    • 年月日
      2015-03-18 – 2015-03-18
  • [学会発表] オンライン百科事典を対象とした日中言語間エンティティリンキング手法の提案 -適切な用語説明ページの抽出手法-2015

    • 著者名/発表者名
      宋 翔, 周 佳良, 堀田 健介, 木村 文則, 前田 亮
    • 学会等名
      第77回情報処理学会全国大会
    • 発表場所
      京都大学吉田キャンパス(京都府)
    • 年月日
      2015-03-18 – 2015-03-18
  • [学会発表] 言語が異なる浮世絵データベース間における同一作品の同定手法の提案2015

    • 著者名/発表者名
      木村 泰典, Biligsaikhan Batjargal, 木村 文則, 前田 亮
    • 学会等名
      第77回情報処理学会全国大会
    • 発表場所
      京都大学吉田キャンパス(京都府)
    • 年月日
      2015-03-17 – 2015-03-17
  • [学会発表] Wikipedia記事の言語間差異抽出手法の提案2015

    • 著者名/発表者名
      原田 一慧, 木村 文則, 前田 亮
    • 学会等名
      第7回データ工学と情報マネジメントに関するフォーラム(DEIM2015)
    • 発表場所
      磐梯熱海ホテル華の湯(福島県)
    • 年月日
      2015-03-04 – 2015-03-04
  • [学会発表] 役者評判記からの人物に関する表現の自動抽出手法2015

    • 著者名/発表者名
      永井 規善, 木村 文則, 前田 亮, 赤間 亮
    • 学会等名
      第4回知識・芸術・文化情報学研究会
    • 発表場所
      立命館大阪梅田キャンパス(大阪府)
    • 年月日
      2015-02-07 – 2015-02-07
  • [学会発表] 東大寺要録からの歴史知識情報の抽出 ―注釈情報の共有を目指して―2014

    • 著者名/発表者名
      佐藤 貴文, 後藤 真, 木村 文則, 前田 亮
    • 学会等名
      人文科学とコンピュータシンポジウム
    • 発表場所
      国立情報学研究所(東京都)
    • 年月日
      2014-12-13 – 2014-12-13
  • [学会発表] 役者評判記からの人物表現抽出手法の提案2014

    • 著者名/発表者名
      永井 規善, 前田 亮, 木村 文則, 赤間 亮
    • 学会等名
      人文科学とコンピュータシンポジウム
    • 発表場所
      国立情報学研究所(東京都)
    • 年月日
      2014-12-13 – 2014-12-13
  • [学会発表] Identifying the Same Records across multiple Ukiyo-e Image Databases Using Textual Data in Different Languages2014

    • 著者名/発表者名
      Biligsaikhan Batjargal, Takeo Kuyama, Fuminori Kimura, and Akira Maeda. Identifying the Same Records across multiple Ukiyo-e Image Databases Using Textual Data in Different Languages
    • 学会等名
      ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014)
    • 発表場所
      London, U.K.
    • 年月日
      2014-09-10 – 2014-09-10
  • [学会発表] Method for Supporting Analysis of Personal Relationships through Place Names Extracted from Documents2014

    • 著者名/発表者名
      Fuminori Kimura and Akira Maeda
    • 学会等名
      ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014)
    • 発表場所
      London, U.K.
    • 年月日
      2014-09-10 – 2014-09-10
  • [学会発表] An Approach to Named Entity Extraction from Historical Documents in Traditional Mongolian Script2014

    • 著者名/発表者名
      Biligsaikhan Batjargal, Garmaabazar Khaltarkhuu, Fuminori Kimura, and Akira Maeda
    • 学会等名
      ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014)
    • 発表場所
      London, U.K.
    • 年月日
      2014-09-09 – 2014-09-09

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi