20年度は、19年度に行った自然言語処理と縄文用語シソーラスを利用した発掘報告書からの縄文時代関連用語の抽出・集計の改良と、これまでに開発した個々の同質的領域のクラスター化手法の統合を行った。自然言語処理に基づく手法により、発掘報告書からデータマイニング的に属性情報を抽出したうえで、報告書間の類似度を計算した(生業的同質性を示す)。これにより得られた属性情報からみた遺跡の同質性と、空間的近接性を組み合わせた尺度をもとにクラスター分析を行うことで、より複合的な観点から同質的領域の広がりを示すことが可能となった。 具体的には愛知県を中心とした東海地方について本手法を適用し、空間的近接性と生業同質性に基づいた遺跡の類型化とグルーピングを行い、自然環境的同質性との比較検討もふまえて手法の評価を行なった。これらの分析結果を相互に比較したところ、地形的な特徴と対応する地域的な偏りや、同じ地形内でも遺跡(発掘報告書)の特徴に応じたグルーピングの違いが認められるなど、妥当性のある結果が得られた。このように、本手法によって得られる結果が地域性を検討するうえでの支援情報としての有用性が認められた一方で、デジタル化された遺跡情報の不足などもあり、十分な評価検証にまで至らなかったことは否めない。これらの各手法の精度(特に生業的同質性)の向上と、より多くのケーススタディに基づく詳細な評価・検証の実施が課題として残された。
|