• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

Research on multilingual integrated access to digital archives of Japanese culture

Research Project

Project/Area Number 20K12567
Research InstitutionRitsumeikan University

Principal Investigator

前田 亮  立命館大学, 情報理工学部, 教授 (20351322)

Co-Investigator(Kenkyū-buntansha) バトジャルガル ビルゲサイハン  立命館大学, 衣笠総合研究機構, 研究員 (30725396)
SONG Yuting  立命館大学, 情報理工学部, 助教 (50849388)
Project Period (FY) 2020-04-01 – 2023-03-31
Keywords多言語処理 / レコード同定 / 情報推薦 / 文字認識 / メタデータ
Outline of Annual Research Achievements

本年度は,日本文化に関わる各種資料のディジタルアーカイブ(以下DA)への統合的な多言語情報アクセス環境を実現する技術の開発に向けて,日本文化DAに対するバイリンガル検索技術,日本文化DAの言語横断レコード同定技術,日本文化DAに対する情報推薦技術,日本文化DAに対する表現学習を用いた情報検索の各技術について研究を行った.
日本文化DAに対するバイリンガル検索および言語横断レコード同定技術に関しては,これまでに研究を進めてきた,言語横断型の単語分散表現を用いて機械翻訳に依存せずに異言語の浮世絵DAから同一作品を同定する手法に関連して,言語横断型の単語分散表現に日本語特有の情報を用いることで分散表現のマッピング精度を向上する手法について,International Journal of Asian Language Processingに論文が掲載された.また,浮世絵のメタデータについて,インターネット上で無料で使用可能な複数の機械翻訳サービスによる翻訳の品質について昨年度に引き続き検討を行った.
日本文化DAに対する情報推薦技術に関しては,新たにWikiArt Emotionsデータセットを用いた絵画のテキストおよび画像によるマルチモーダル情報推薦手法について検討を行った.日本文化DAに対する表現学習を用いた情報検索技術に関しては,印鑑画像を対象とした教師無し学習に基づく検索手法および文字セグメンテーション手法,単一事例表現学習に基づく古代文字認識手法,色情報および構造情報を用いたクロスモーダル表現学習に基づく画像検索手法について研究を行った.このうち単一事例表現学習に基づく古代文字認識手法について,国際ジャーナルDataに論文が掲載された.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究課題の目標である,日本文化に関わる各種資料のディジタルアーカイブ(以下DA)への統合的な多言語情報アクセス環境を実現する技術の開発に向けて,ほぼ計画通りに研究を進めることができた.特に,日本文化DAに対するバイリンガル検索および言語横断レコード同定技術に関して,機械翻訳に依存せずに異言語の浮世絵DAから同一作品を同定する手法に関連して,言語横断型の単語分散表現に日本語特有の情報を用いることで分散表現のマッピング精度を向上する手法を提案し,Bilingual Lexicon Inductionタスクにおいて特に日本語由来の単語について精度が向上することを実証できた.また,日本文化DAに対する情報推薦技術に関しては,主に西洋絵画を対象としたWikiArt Emotionsデータセットを用いた絵画のテキストおよび画像によるマルチモーダル情報推薦手法について検討を行った.本データセットを用いることにより,適切な評価用データセットが存在しない日本文化DAに対し,より客観的な性能評価に繋がることが期待できる.日本文化DAに対する表現学習を用いた情報検索技術に関しては,まず,印鑑画像を対象とした教師無し学習に基づく検索手法および文字セグメンテーション手法を提案し,印鑑特有の有効な特徴を明らかにすることができた.また,単一事例表現学習に基づく古代文字認識手法では,各文字に対して単一あるいは少数の字形データしか入手できない文字体系に対して,有効なデータ拡張手法および学習手法を提案することができた.さらに,色情報および構造情報を用いたクロスモーダル表現学習に基づく画像検索手法では,曖昧な言葉で表現された色のテキスト情報を用いることで,より人間の感覚に適応した新たな画像検索機能を実現することができた.

Strategy for Future Research Activity

次年度は最終年度であり,日本文化ディジタルアーカイブ(以下DA)に対するバイリンガル検索および言語横断レコード同定技術,日本文化DAに対する情報推薦技術,日本文化DAに対する表現学習を用いた情報検索技術の各技術について,以下の検討を行い,最終的な成果としてまとめる.日本文化DAに対するバイリンガル検索および言語横断レコード同定技術に関しては,これまで提案してきた各種手法の実稼働システムへの実装を目標として研究を進める.また,これまでの研究成果をまとめて学術論文誌に投稿する.日本文化DAに対する情報推薦技術に関しては,これまで提案してきた推薦手法を立命館大学アート・リサーチセンターで公開している浮世絵データベースに実装する.また,これまでの研究成果をまとめて学術論文誌に投稿する.日本文化DAに対する表現学習を用いた情報検索技術に関しては,古代文字の検索タスクにおいて実用的な精度を得ることを目指して研究を進め,実際の日本文化DAにおける蔵書印や落款印を対象として検索性能の評価実験を行う.これらの研究の成果を学術論文誌に投稿する.また,クロスモーダル表現学習に基づく画像検索手法に関しては,大規模な浮世絵データセットを用いた評価実験を行い,研究成果をまとめた論文を国際会議および学術論文誌に投稿する.

Causes of Carryover

(理由)
物品費については,各提案手法について検討の結果,当初購入を予定していた設備ではなく既存の設備で研究を進めることが可能となったため.また,旅費については,当初は国内外での学会発表のための旅費・参加費に使用する予定であったが,コロナ禍によりほとんどの学会がオンライン開催および参加費無料となったことから,経費を使用する必要がなくなったため.
(使用計画)
次年度使用額は,主にリサーチアシスタントを雇用するための資金,研究補助のアルバイト謝金,研究成果の学術論文誌への論文掲載料等に充てる計画である.

  • Research Products

    (6 results)

All 2022 2021

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (5 results) (of which Int'l Joint Research: 3 results)

  • [Journal Article] A Prototypical Network-Based Approach for Low-Resource Font Typeface Feature Extraction and Utilization2021

    • Author(s)
      Li Kangying、Batjargal Biligsaikhan、Maeda Akira
    • Journal Title

      Data

      Volume: 6 Pages: -

    • DOI

      10.3390/data6120134

    • Peer Reviewed / Open Access
  • [Presentation] Sentence Pair Augmentation Approach for Grammatical Error Correction2022

    • Author(s)
      Ryoga Nagai and Akira Maeda
    • Organizer
      1st International Conference on Computational Intelligence for Engineering and Management Applications (CIEMA 2022)
    • Int'l Joint Research
  • [Presentation] Dataset Augmentation for Grammatical Error Correction Using Markov Chain2021

    • Author(s)
      Ryoga Nagai and Akira Maeda
    • Organizer
      World Congress on Engineering (WCE2021)
    • Int'l Joint Research
  • [Presentation] Joint Extraction of Clinical Entities and Relations Using Multi-head Selection Method2021

    • Author(s)
      Xintao Fang, Yuting Song, and Akira Maeda
    • Organizer
      2021 International Conference on Asian Language Processing (IALP 2021)
    • Int'l Joint Research
  • [Presentation] 経営哲学に関するテキストにおける検索結果の多様性を考慮した検索システム2021

    • Author(s)
      東雲 陽美, 青山 敦, 前田 亮
    • Organizer
      人文科学とコンピュータシンポジウム
  • [Presentation] 役者評判記を用いた役者情報の抽出2021

    • Author(s)
      川端 恵大, 前田 亮, 赤間 亮
    • Organizer
      人文科学とコンピュータシンポジウム

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi