2017 Fiscal Year Annual Research Report
日本考古学国際化のための考古学関係用語シソーラス構築と自動英語化の研究
Project/Area Number |
16H05881
|
Research Institution | Nara National Research Institute for Cultural Properties |
Principal Investigator |
高田 祐一 独立行政法人国立文化財機構奈良文化財研究所, 企画調整部, 研究員 (50708576)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | データベース / 発掘調査報告書 / シソーラス / 考古学 / 国際化 / 多言語化 / 考古学ビッグデータ / 自然言語処理 |
Outline of Annual Research Achievements |
本研究は、考古学関係用語シソーラスおよび考古学関係用語の日英対訳データベースを構築し、全国の発掘報告書の全文データを格納している「全国遺跡報告総覧」システムを拡張開発することで日本考古学の国際化に資することを目的とする。 2017年度は次の4点の実績があった。①発掘調査報告書の頻出用語俯瞰図の生成。全国遺跡報告総覧に登録されている 約 18,000 件の報告書(テキストデータ 15 億文字)に対し、考古学関係用語の出現回数を集計し、図化した。報告書が何を重点的に記載しているのかが客観的に把握できるようになった。②発掘調査報告書の頻出用語の生成。考古学関係用語を報告書ごとに集計し、多いもの(頻出用語)を報告書詳細ページに表示する。この頻出用語を絞込検索に使用することで、直接的に関係のない検索結果(ノイズ)を除外し、高精度な検索が可能となった。今後、頻出用語の構成を分析することで、内容が類似する報告書を利用者に自動提示することが可能になった。③考古学関係用語の語彙数の拡充。システム内部に考古学関係用語辞書を保持しており、本文頻出用語の集計・報告書ワードマップ生成等に利用している。46182語から70411語に拡充した。より細かい用語判別が可能となった。④文化財調査報告書と文化財イベント情報連携機能の強化。文化財イベントの内容と類似している報告書類を自動表示する機能を公開した。文化財イベントの本文情報について、特徴語を抽出し、その語の構成と類似の報告書類を自動表示する。文化財イベント参加前後に内容類似の報告書類を閲覧することにより、理解を深める効果を見込める。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初計画通り順調に推移している。
|
Strategy for Future Research Activity |
今後は、引き続き用語に関する情報を収集し、考古学関係用語シソーラスの充実を図る。
|