2019 Fiscal Year Annual Research Report
Research on Cross-Language Record Linkage for Multilingual Digital Archives
Project/Area Number |
16K00452
|
Research Institution | Ritsumeikan University |
Principal Investigator |
前田 亮 立命館大学, 情報理工学部, 教授 (20351322)
|
Co-Investigator(Kenkyū-buntansha) |
バトジャルガル ビルゲサイハン 立命館大学, 衣笠総合研究機構, 研究員 (30725396)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | メタデータ / 浮世絵 / レコード同定 / エンティティリンキング / 情報図書館学 / 多言語処理 / ディジタルアーカイブ |
Outline of Annual Research Achievements |
本年度は,本研究課題の目標である,世界中に散在するディジタルアーカイブ間の同一実体レコードを自動的に発見し,それらをリンクさせる技術の開発に向けて,前年度に引き続き,主に言語横断レコード同定に関する研究を行った.浮世絵のディジタルアーカイブを対象とし,昨年度から研究を進めている言語横断型の単語分散表現(word embedding)を用いる手法を改良した.具体的には,作品名に含まれる各単語の分散表現を加算したものを作品名のベクトルとして用いる手法および,起点言語と目標言語の作品名に含まれる全ての単語の組み合わせについてマッチングを行う手法の2種類の手法を提案し,同定精度の比較を行った.評価実験の結果,特に後者の手法において同定精度が向上することを示した.また,江戸東京博物館(日本語),メトロポリタン美術館(英語),アムステルダム国立美術館(オランダ語)の3カ国語のデータベースを用いて提案手法による言語横断レコード同定の評価実験を行い,異なる言語のデータベース間において同一の浮世絵作品を同定する手法について,実用的な精度に繋がる一定の見通しを得ることができた.さらに,言語横断レコード同定の新たな対象として,異言語の映画データベース間において同一作品を同定する手法の研究を行った. 研究期間全体を通じた研究成果として,多言語かつ異種のディジタルアーカイブから同一実体を表す関連レコードを発見して動的にリンクさせることで,これまで個別にアクセスするしか方法がなかった複数のディジタルアーカイブに対して統一的なアクセス手段を提供するという当初の目標を達成することができた.
|
Research Products
(6 results)