本研究はマクロ的な歴史現象に関する考古学研究のために、発掘調査報告書の文章に対して自然言語処理技術を適用し、発掘調査報告書間の類似度を算出することで、類似度の高い、つまり文化的に関連する遺跡同士を抽出する手法を開発する。本手法の適用先としては、例えば、縄文から弥生への文化変容についての約1万間の日本列島全体における大局的な展開を想定している。本手法を開発することで考古学研究者は、遺物や遺構など複雑な要素で構成される文化の伝播を研究する際に、従来のように発掘調査報告書を1冊ずつ虱潰しに読んだうえで必要な情報かどうかを判断するという多大な労力から解放され、容易に長期間の広域における大局的な展開の把握が可能となる。さらに、これによって従来になかった再発見や再解釈につながることが期待できる。研究の最終年度に当たる第3年度(2023年度)としては、以下のこれまでの成果を学術論文に投稿し、刊行した。 ・既存の考古学研究論文におけて類似している遺跡として分類されている4遺跡の発掘調査報告書(128冊)に対して、分冊毎に自然言語言語処理と行う場合と同一遺跡でまとめた文章を自然言語言語処理と行う場合で整合性を確認した。 ・上記の4遺跡の発掘調査報告書(128冊)に対して、既存の考古学研究論文で対象としている縄文時代と弥生時代に関する記述だけを抜き出した文章を自然言語言語処理と行い整合性を確認した。 ・上記の4遺跡の発掘調査報告書(128冊)に対して、ベクトルの加法構成性を利用して、既存の考古学研究論文で対象としている縄文時代と弥生時代の関する記述の分散表現だけを取得し整合性を確認した。 以上の結果により、自然言語処理に基づく発掘報告書の文章の類似性は、考古学遺跡の類似性を反映することができることがわかった。
|