本研究はマクロ的な歴史現象に関する考古学研究のために、発掘調査報告書の文章に対して自然言語処理技術を適用し、発掘調査報告書間の類似度を算出することで、類似度の高い、つまり文化的に関連する遺跡同士を抽出する手法を開発した。具体的には既存の考古学研究論文において類似している遺跡として分類されている遺跡の発掘調査報告書に対して自然言語処理を行い類似度を算出して、既存の考古学研究論文における分類との整合性を確認できた。この結果により本アプローチは、専門用語の表記揺れが多くコーパスも十分に整備されていない発掘調査報告書に対して、有効なものであることがわかった。
|