2022 Fiscal Year Research-status Report
自然言語処理による日本列島全体における考古遺跡の時空間動態の把握
Project/Area Number |
21K21323
|
Research Institution | Osaka Institute of Technology |
Principal Investigator |
坂平 文博 大阪工業大学, 情報科学部, 准教授 (70578129)
|
Project Period (FY) |
2021-08-30 – 2024-03-31
|
Keywords | 自然言語処理 / 考古遺跡 / 発掘調査報告書 |
Outline of Annual Research Achievements |
本研究はマクロ的な歴史現象に関する考古学研究のために、発掘調査報告書の文章に対して自然言語処理技術を適用し、発掘調査報告書間の類似度を算出することで、類似度の高い、つまり文化的に関連する遺跡同士を抽出する手法を開発する。本手法の適用例として縄文から弥生への文化変容について約1万間の日本列島全体における大局的な展開を検討する。本手法を開発することで考古学研究者は、遺物や遺構など複雑な要素で構成される文化の伝播を研究する際に、従来のように発掘調査報告書を1冊ずつ虱潰しに読んだうえで必要な情報かどうかを判断するという多大な労力から解放され、容易に長期間の広域における大局的な展開の把握が可能となることで、従来になかった再発見や再解釈につながることが期待できる。研究の第2年度(2022年度)としては、具体的な検証実施フェーズとして次の4点について研究を実施した。 (1)既存の考古学研究論文におけて類似している遺跡として分類されている4遺跡の発掘調査報告書(128冊)に対して、分冊毎に自然言語言語処理と行う場合と同一遺跡でまとめた文章を自然言語言語処理と行う場合で整合性を確認した。 (2)上記の4遺跡の発掘調査報告書(128冊)に対して、既存の考古学研究論文で対象としている縄文時代と弥生時代に関する記述だけを抜き出した文章を自然言語言語処理と行い整合性を確認した。 (3)上記の4遺跡の発掘調査報告書(128冊)に対して、ベクトルの加法構成性を利用して、既存の考古学研究論文で対象としている縄文時代と弥生時代の関する記述の分散表現だけを取得し整合性を確認した。 (4)上記(1)~(3)の成果を海外国際会議録および学術論文にまとめ、投稿した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
新型コロナウィルスの流行及び半導体の製造及びサプライチェーンの障害により、当初予定していた国際会議への参加及び高速計算機の導入が計画に対して、2021年度から2022年度にスライドしたため、全体として約半年強遅れでの進行となった。
|
Strategy for Future Research Activity |
今後は、研究の第1年度(2021年度)と第2年度(2022年度)の成果を学術論文として公開する予定である。また今後のさらなる研究の進展を見据えて、GPT-4などの最新の自然言語処理の技術を適用する方法を模索する。
|
Causes of Carryover |
成果公開のための英文校正料及び論文掲載料の支払いが2023年度分に繰り越したため、2023年度分は英文校正料及び論文掲載料を支出する。
|