研究実績の概要 |
本研究は、考古学関係用語シソーラスおよび考古学関係用語の日英対訳データベースを構築し、全国の発掘報告書の全文データを格納している「全国遺跡報告総覧」システムを拡張開発することで日本考古学の国際化に資することを目的とする。 2017年度は次の4点の実績があった。①発掘調査報告書の頻出用語俯瞰図の生成。全国遺跡報告総覧に登録されている 約 18,000 件の報告書(テキストデータ 15 億文字)に対し、考古学関係用語の出現回数を集計し、図化した。報告書が何を重点的に記載しているのかが客観的に把握できるようになった。②発掘調査報告書の頻出用語の生成。考古学関係用語を報告書ごとに集計し、多いもの(頻出用語)を報告書詳細ページに表示する。この頻出用語を絞込検索に使用することで、直接的に関係のない検索結果(ノイズ)を除外し、高精度な検索が可能となった。今後、頻出用語の構成を分析することで、内容が類似する報告書を利用者に自動提示することが可能になった。③考古学関係用語の語彙数の拡充。システム内部に考古学関係用語辞書を保持しており、本文頻出用語の集計・報告書ワードマップ生成等に利用している。46182語から70411語に拡充した。より細かい用語判別が可能となった。④文化財調査報告書と文化財イベント情報連携機能の強化。文化財イベントの内容と類似している報告書類を自動表示する機能を公開した。文化財イベントの本文情報について、特徴語を抽出し、その語の構成と類似の報告書類を自動表示する。文化財イベント参加前後に内容類似の報告書類を閲覧することにより、理解を深める効果を見込める。
|