研究課題/領域番号 |
16K00452
|
研究機関 | 立命館大学 |
研究代表者 |
前田 亮 立命館大学, 情報理工学部, 教授 (20351322)
|
研究分担者 |
バトジャルガル ビルゲ 立命館大学, 総合科学技術研究機構, 研究員 (30725396)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | メタデータ / 浮世絵 / レコード同定 / エンティティリンキング |
研究実績の概要 |
本年度は,本研究課題の目標である,世界中に散在するディジタルアーカイブ間の同一実体レコードを自動的に発見し,それらをリンクさせる技術の開発の開発に向けて,主に言語横断レコード同定に関する研究を行った.また,ディジタルアーカイブ内のテキスト中で言及されているエンティティ(実体)から,それを説明する別言語の知識ベースの記事に自動的にリンクする言語横断エンティティリンキングの研究を行った. 同一作品の同定手法に関しては,浮世絵のディジタルアーカイブを対象とし,従来のメタデータの辞書による翻訳および単語レベルのマッチングによる手法に加え,固有名詞の逆翻訳(back transliteration)に基づく手法および,単語の分散表現(word embedding)を用いた意味的マッチングに基づく手法を提案した.実験の結果,固有名詞の逆翻訳および単語の分散表現を用いることにより,従来の単語マッチングに基づく手法と比較して,言語横断レコード同定の精度向上に有効であることを示した. 言語横断エンティティリンキングに関しては,ディジタルアーカイブ内のメタデータなどのテキスト中に記述されているエンティティ(実体)から,それを説明する別言語のディジタルアーカイブのレコードに自動的にリンクすることを目標として,リンク対象となるエンティティを利用者の言語レベルに応じて動的に抽出する手法および,元テキストと説明テキストの類似度に基づくエンティティの曖昧性解消手法を提案した.実験の結果,従来手法と比較して,より適切な言語横断エンティティリンキングが実現可能なことを示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題の目標である,世界中に散在するディジタルアーカイブ間の同一実体レコードを自動的に発見し,それらをリンクさせる技術の開発の開発に向けて,ほぼ計画通りに研究を進めることができた.特に,固有名詞の逆翻訳(back transliteration)に基づく手法および,単語の分散表現(word embedding)を用いた意味的マッチングに基づく手法により,従来の辞書による翻訳と単語のマッチングに基づく手法と比較して,大幅な精度向上を見込める手法を提案できたことは,大きな成果であると考えている.
|
今後の研究の推進方策 |
次年度は,同一作品の同定手法の研究を中心に,より同定精度を向上させるために,作品名以外のメタデータ要素の利用,単語の分散表現を用いた手法におけるより適切なコーパスや学習モデルの検討を行う.また,現在対象としている浮世絵以外の他のディジタルアーカイブへの対応,日本語と英語以外の他国語への対応を行うことを検討している.本研究の成果は,複数の国内会議および国際会議において発表を行う予定である.また,研究成果をまとめた論文を学術論文誌に投稿する.
|
次年度使用額が生じた理由 |
成果発表のための旅費として計上していた金額が,当初の見積もりよりも少額で済むことになったため.
|
次年度使用額の使用計画 |
次年度使用額は,主に成果発表のための旅費の一部に充てる計画である.
|