研究課題/領域番号 |
24500300
|
研究機関 | 立命館大学 |
研究代表者 |
前田 亮 立命館大学, 情報理工学部, 教授 (20351322)
|
研究分担者 |
木村 文則 尾道市立大学, 経済情報学部, 講師 (70516690)
|
研究期間 (年度) |
2012-04-01 – 2016-03-31
|
キーワード | ティジタルアーカイブ / ティジタル図書館 / 多言語処理 / 言語横断レコード同定 / 言語横断エンティティリンキング |
研究実績の概要 |
本年度は,本研究課題の目標である多言語ディジタルアーカイブの統合検索の実現に向けて,昨年度に引き続き,主に複数データベース間における同一作品を自動的に同定する手法ついて研究を行った.また,ディジタルアーカイブ内のテキスト中で言及されているエンティティ(実体)から,それを説明する別言語の知識ベースの記事に自動的にリンクする言語横断エンティティリンキングの研究を行った. 同一作品の同定手法に関しては,浮世絵のディジタルアーカイブを対象とし,これまでに手法を確立した,作品名の音訳と英訳の比較,原題と音訳の比較に加え,原題と英訳の比較を行う手法を新たに提案した.また,浮世絵の作品名の翻訳では,作品名をそのまま直訳するのではなく,浮世絵が描写している風景や対象を説明するような翻訳が行われる場合が少なからず存在するが,このような「描写的」な作品名についても同定を行う手法を提案した.さらに,これまで対象としていた英語だけでなく,他の言語に対応する手法を新たに提案し,オランダ語の浮世絵ディジタルアーカイブを対象とした評価実験を行った. 言語横断エンティティリンキングに関しては,ディジタルアーカイブ内のメタデータなどのテキスト中に記述されているエンティティ(実体)から,それを説明する別言語のディジタルアーカイブのレコードに自動的にリンクすることを目標として,リンク対象とする人名などの固有表現の自動抽出手法,エンティティ記述の翻訳手法,対象リンク先の曖昧性解消手法について研究を行った. 研究機関全体を通じた研究成果として,言語が異なるティジタルアーカイブの関連レコード同士を結びつけることで,これまで個別にアクセスするしか方法がなかった複数のディジタルアーカイブに対して統一的なアクセス手段を提供するという当初の目標を達成することができた.
|