研究課題/領域番号 |
20K12567
|
研究機関 | 立命館大学 |
研究代表者 |
前田 亮 立命館大学, 情報理工学部, 教授 (20351322)
|
研究分担者 |
バトジャルガル ビルゲサイハン 立命館大学, 衣笠総合研究機構, 研究員 (30725396)
SONG Yuting 立命館大学, 情報理工学部, 助教 (50849388)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 多言語処理 / レコード同定 / 情報推薦 / 文字認識 / メタデータ |
研究実績の概要 |
本年度は,日本文化に関わる各種資料のディジタルアーカイブ(以下DA)への統合的な多言語情報アクセス環境を実現する技術の開発に向けて,日本文化DAに対するバイリンガル検索技術,日本文化DAの言語横断レコード同定技術,日本文化DAに対する情報推薦技術,日本文化DAに対する表現学習を用いた情報検索の各技術について研究を行った. 日本文化DAに対するバイリンガル検索および言語横断レコード同定技術に関しては,これまでに研究を進めてきた,言語横断型の単語分散表現を用いて機械翻訳に依存せずに異言語の浮世絵DAから同一作品を同定する手法に関連して,言語横断型の単語分散表現に日本語特有の情報を用いることで分散表現のマッピング精度を向上する手法について,International Journal of Asian Language Processingに論文が掲載された.また,浮世絵のメタデータについて,インターネット上で無料で使用可能な複数の機械翻訳サービスによる翻訳の品質について昨年度に引き続き検討を行った. 日本文化DAに対する情報推薦技術に関しては,新たにWikiArt Emotionsデータセットを用いた絵画のテキストおよび画像によるマルチモーダル情報推薦手法について検討を行った.日本文化DAに対する表現学習を用いた情報検索技術に関しては,印鑑画像を対象とした教師無し学習に基づく検索手法および文字セグメンテーション手法,単一事例表現学習に基づく古代文字認識手法,色情報および構造情報を用いたクロスモーダル表現学習に基づく画像検索手法について研究を行った.このうち単一事例表現学習に基づく古代文字認識手法について,国際ジャーナルDataに論文が掲載された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題の目標である,日本文化に関わる各種資料のディジタルアーカイブ(以下DA)への統合的な多言語情報アクセス環境を実現する技術の開発に向けて,ほぼ計画通りに研究を進めることができた.特に,日本文化DAに対するバイリンガル検索および言語横断レコード同定技術に関して,機械翻訳に依存せずに異言語の浮世絵DAから同一作品を同定する手法に関連して,言語横断型の単語分散表現に日本語特有の情報を用いることで分散表現のマッピング精度を向上する手法を提案し,Bilingual Lexicon Inductionタスクにおいて特に日本語由来の単語について精度が向上することを実証できた.また,日本文化DAに対する情報推薦技術に関しては,主に西洋絵画を対象としたWikiArt Emotionsデータセットを用いた絵画のテキストおよび画像によるマルチモーダル情報推薦手法について検討を行った.本データセットを用いることにより,適切な評価用データセットが存在しない日本文化DAに対し,より客観的な性能評価に繋がることが期待できる.日本文化DAに対する表現学習を用いた情報検索技術に関しては,まず,印鑑画像を対象とした教師無し学習に基づく検索手法および文字セグメンテーション手法を提案し,印鑑特有の有効な特徴を明らかにすることができた.また,単一事例表現学習に基づく古代文字認識手法では,各文字に対して単一あるいは少数の字形データしか入手できない文字体系に対して,有効なデータ拡張手法および学習手法を提案することができた.さらに,色情報および構造情報を用いたクロスモーダル表現学習に基づく画像検索手法では,曖昧な言葉で表現された色のテキスト情報を用いることで,より人間の感覚に適応した新たな画像検索機能を実現することができた.
|
今後の研究の推進方策 |
次年度は最終年度であり,日本文化ディジタルアーカイブ(以下DA)に対するバイリンガル検索および言語横断レコード同定技術,日本文化DAに対する情報推薦技術,日本文化DAに対する表現学習を用いた情報検索技術の各技術について,以下の検討を行い,最終的な成果としてまとめる.日本文化DAに対するバイリンガル検索および言語横断レコード同定技術に関しては,これまで提案してきた各種手法の実稼働システムへの実装を目標として研究を進める.また,これまでの研究成果をまとめて学術論文誌に投稿する.日本文化DAに対する情報推薦技術に関しては,これまで提案してきた推薦手法を立命館大学アート・リサーチセンターで公開している浮世絵データベースに実装する.また,これまでの研究成果をまとめて学術論文誌に投稿する.日本文化DAに対する表現学習を用いた情報検索技術に関しては,古代文字の検索タスクにおいて実用的な精度を得ることを目指して研究を進め,実際の日本文化DAにおける蔵書印や落款印を対象として検索性能の評価実験を行う.これらの研究の成果を学術論文誌に投稿する.また,クロスモーダル表現学習に基づく画像検索手法に関しては,大規模な浮世絵データセットを用いた評価実験を行い,研究成果をまとめた論文を国際会議および学術論文誌に投稿する.
|
次年度使用額が生じた理由 |
(理由) 物品費については,各提案手法について検討の結果,当初購入を予定していた設備ではなく既存の設備で研究を進めることが可能となったため.また,旅費については,当初は国内外での学会発表のための旅費・参加費に使用する予定であったが,コロナ禍によりほとんどの学会がオンライン開催および参加費無料となったことから,経費を使用する必要がなくなったため. (使用計画) 次年度使用額は,主にリサーチアシスタントを雇用するための資金,研究補助のアルバイト謝金,研究成果の学術論文誌への論文掲載料等に充てる計画である.
|