研究課題/領域番号 |
26280122
|
研究機関 | 京都大学 |
研究代表者 |
柴山 守 京都大学, 国際交流推進機構, 研究員 (10162645)
|
研究分担者 |
森本 晋 独立行政法人国立文化財機構奈良文化財研究所, その他部局等, その他 (40220082)
原 正一郎 京都大学, 地域研究統合情報センター, 教授 (50218616)
田代 亜紀子 北海道大学, その他の研究科, 准教授 (50443148)
山田 太造 東京大学, 史料編纂所, 助教 (70413937)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 東南アジア / 考古学 / データ工学 / 知識ベース / RDF / GIS |
研究実績の概要 |
本研究は、東南アジア大陸部の考古情報(約15,600件)を事例に、遺跡・遺物データ群のオントロジー指向による知識体系化と知識ベースの構築に関する研究を目的にする。 平成27年度の研究においては、(1)東南アジア考古遺跡データベース(DB)の構築:RDF化に伴う東南アジア考古遺跡DBの構築が必要であった。そのために各国の遺跡情報データの属性の統一化を検討し、本DBの時空間可視化機能でデータの検証・整合性を確認することを目的にした。特にデータの属性の統一化においては、(1)遺跡・遺物に関するタイ語説明・表現を英語に翻訳すると共に、キーワードを抽出し、オントロジー体系化のためのツリー構造表現を実現した。(2)遺跡情報のRDF化分析を行なうために、(1)におけるツリー構造を探索するブラウザー“Archaeo Ontology”を新たに開発し、Linked Open Data (LOD)にもとづく検索を実現するための予備実験を行った。また、研究に使える資源共有化システムに必要な機能および実装に関わる課題を検証するためのLinked Open Dataの構築法を検討した。(3)東南アジア考古遺跡情報に関するワークショップ(WS)の開催では、全体の研究計画の調整と東南アジア考古遺跡DBの理解・分析、およびRDF・LOD技術の研究のための研究会(WS)および国際ワークショップIWASTCS2015を平成27年11月13日タイ・バンコクにて開催した。(4)遺跡情報は、地域研究におけるフィールドノートの性格と類似した属性が認められる。そのために事例として位置情報とトピックモデルに基づくフィールドノートのビジュアライズ手法、地域研究資料を対象とした時空間情報に着目したデータの構造化などの研究を進め、東南アジア考古遺跡情報への応用について検討した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
(理由) 平成27年度における研究目標は、(1) 東南アジア考古遺跡データベース(DB)の構築において、RDF化に伴う形態素解析・語彙分析 、キーワード共起関係などの基本情報の分析にもとづいて、属性定義とそれらを検証する枠組みを確立することであった。そのためには前提として、東南アジア考古遺跡DBの構築が必要になる。本作業においては、特に空間情報を伴うタイ国考古情報について、形態素解析が必要なタイ語説明から英語への翻訳を行ない、キーワードを抽出してカテゴリー化し、RDF記述のための基礎的研究を進めた。特に、RDF記述のためにはカテゴリー化されたキーワード情報を探索するブラウザーが必要になり、タイの遺跡情報を探索するブラウザー”Archaeo Ontology”を新たに開発した。本ブラウザーの開発によって、RDF記述のための第一段階が達成された。当初の予定からみて順調に進捗している。(2)RDF化に伴う基本情報の分析では、基本情報の分析は、DBの属性毎に出現する体言の「値」と「値・値」関係(例えば、地名と遺跡時代の関係、あるいは同義語関係)などの連鎖や共起ネットワークが認識されるようなデータ表現を可能にした。そのため、データの正規化のためのデータ修正を実施し、時代区分に応じたデータの特徴を把握するするためにGIS分析とマッピングを行なって、データ全体の特徴把握に努めた。タイ語表現による記述では、形態素解析を行った後、キーワードの英語表現および日本語への変換が完了した。本データに最適な語彙の解析手法は、分担者によって示されるトピックマップなどのいくつかの手法の結果を総合的に判断して決定する検討を継続して進めている。また、「値・値」関係のリストのうち、同義語についてシソーラス辞書の構築を開始した。いずれの年次課題についても概ね順調に進捗している。
|
今後の研究の推進方策 |
平成28年度において、(1)ArcOnBase知識ベース・語彙概念体系の研究と構築については、オントロジー化の中心的研究と作業を実施しなければならない。従来の考古遺物情報の標準化における体系化や構造を前提として、ブラウザー”ArchaeoOntology”から得られたツリー構造をトピックマップ分析や共起ネットワークからの結果と比較・検討して、ArcOnBase知識ベースの実現に向けた知識体系化の研究を進める。その際に地名や時代変遷を考慮することが必要で、メタ情報の在り方、時空間分析の手法を活用し、考古遺跡情報におけるメタ情報の知識を総合的に検討して、体系化を実現する。具体的には、(1)遺跡情報データベースにおいて、基礎分析としてのトピックマップによるデータの出現特徴を把握して、知識ベースの体系化・構造化を検討する。(2)RDF化とLOD設計・実現のための基礎的な実験については、研究資源の記述において、RDF記述の適応を検討する。さらにWeb世界に存在する資源やデータを紐付けし、意味空間を形成するLODを導入する実験を行う。(3)類似性・特徴パターン探索機能の実現に向けた研究と基礎的な実験および評価では、RDF記述における推論的な手法をも検討するために、クエリー言語としてSPARQL言語をひとつの候補としながらも、あらゆる実現手法について検討・実験する。また、東南アジア考古遺跡DBおよび基本情報の分析についての検証・評価を行い、整合性や問題点を検討する。(4)考古遺跡情報に関するワークショップ(WS)の開催では、研究進捗状況のWSをタイで開催する。
|
次年度使用額が生じた理由 |
平成27年度における研究目標において、東南アジア考古遺跡データベース(DB)の構築がひとつの目標であり、当初計画では新たにRDF化を検討するブラウザー”Archaeo Ontology”の日英版を外部委託により開発を進めた。しかし、新たなツール開発に係る経費が当面の予想を下回り、且つ国際ワークショップの経費も開催場所の検討、関係者の招聘等で節約が可能となり、次年度に繰り越すことで、より効果的な研究が進められることが分かった。 また、平成28年度において、ArcOnBase知識ベース開発のためのさらなる経費の増大が予測され、これらへの対処が必要になった。この結果、研究代表者および分担者自身の次年度使用額への変更が生じた。
|
次年度使用額の使用計画 |
平成27年度に計画した遺跡データの形態素解析やキーワードのカテゴリー化にもとづいて、(1)ArcOnBase知識ベース・語彙概念体系の研究と構築についての分析を進めるための経費、(2)RDF化とLOD設計・実現のための基礎的な実験については、研究資源の記述において、RDF記述の適応を検討する。さらにWeb世界に存在する資源やデータを紐付けし、意味空間を形成するLODを導入する実験を行うための経費、(3)類似性・特徴パターン探索機能の実現に向けた研究と基礎的な実験を遂行するための経費、(4)考古遺跡情報に関する現地からの参加も得た国際ワークショップ(W S)の開催(タイ・ナコーンナヨック県)により、研究進捗状況を公開するための経費として計画する。
|