研究課題/領域番号 |
26280122
|
研究機関 | 京都大学 |
研究代表者 |
柴山 守 京都大学, 国際交流推進機構, 研究員 (10162645)
|
研究分担者 |
森本 晋 独立行政法人国立文化財機構奈良文化財研究所, 企画調整部, 室長 (40220082)
原 正一郎 京都大学, 地域研究統合情報センター, 教授 (50218616)
田代 亜紀子 独立行政法人国立文化財機構奈良文化財研究所, 企画調整部, アソシエイトフェロー (50443148)
山田 太造 東京大学, 史料編纂所, 助教 (70413937)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 東南アジア / 考古学 / データ工学 / 知識ベース / RDF / GIS |
研究実績の概要 |
本研究は、東南アジア大陸部の考古情報(約15,600件)を事例に、遺跡・遺物データ群のオントロジー指向による知識体系化と知識ベースの構築に関する研究を目的にする。 平成26年度の研究においては、(1)東南アジア考古遺跡データベース(DB)の構築:RDF化に伴う東南アジア考古遺跡DBの構築が必要であった。そのために各国の遺跡情報データの属性の統一化を検討し、本DBの時空間可視化機能でデータの検証・整合性を確認することを目的にした。特にデータの検証においては、遺跡・遺物に関するタイ語説明・表現を英語に翻訳し、GISによる単純マッピングでの検証をおこない、分析効率を高める前準備を進めた。(2)遺跡情報のRDF化分析を行なうために、遺跡情報に重要な要素である事例として地名オントロジーデータベースとの連携をおこなう地名エディタの試作を行った。研究に使える資源共有化システムに必要な機能および実装に関わる課題を検証するためのLinked Open Dataを構築した。(3)東南アジア考古遺跡情報に関するワークショップ(WS)の開催では、全体の研究計画の調整と東南アジア考古遺跡DBの理解・分析、およびRDF・LOD技術の研究のための研究会(WS)を平成26年6月27日タイ・バンコクで行い、また平成27年1月5日バンコクにてANGIS and CRMA Bangkok Meeting 2015を開催した。(4)遺跡情報は、地域研究におけるフィールドノートの性格と類似した属性が認められる。そのために事例として位置情報とトピックモデルに基づくフィールドノートのビジュアライズ手法、地域研究資料を対象とした時空間情報に着目したデータの構造化などの研究を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成26年度における研究目標は、(1) 東南アジア考古遺跡データベース(DB)の構築において、RDF化に伴う形態素解析・語彙分析、キーワード共起関係などの基本情報の分析を行うことであった。そのためには前提として、東南アジア考古遺跡DBの構築が必要になる。本作業においては、特に空間情報を伴うタイ国考古情報について、形態素解析が必要なタイ語説明から英語への翻訳を行ない、GISによる単純マッピング分析によるデータの特徴および属性について把握した。なお、当初計画では「Myデーターベース」を利用することを検討したが、研究過程で必ずしも必要でないことから表形式データベースでの分析を進めた。当初の予定からみて順調に進捗している。(2)RDF化に伴う基本情報の分析では、基本情報の分析は、DBの属性毎に出現する体言の「値」と「値・値」関係(例えば、地名と遺跡時代の関係、あるいは同義語関係)などの連鎖や共起ネットワークが認識されるようなマイニングを目指した。そのため、データの正規化のためのデータ修正を実施し、時代区分に応じたデータの特徴を把握するするためにGIS分析とマッピングを行なって、データ全体の特徴把握に努めた。タイ語表現による記述では、形態素解析を行った後、英語表現への変換が完了した。さらに英語表現に対する適切な解析手法を検討し、解析プログラムの作成も進捗している。本データに最適な語彙の解析手法は、分担者によって示されるトピックマップなどのいくつかの手法の結果を総合的に判断して決定することを検討している。また、「値・値」関係のリストのうち、同義語についてシソーラス辞書の構築を開始した。いずれの年次課題についても概ね順調に進捗している。
|
今後の研究の推進方策 |
平成27年度において、(1)ArcOnBase知識ベース・語彙概念体系の研究と構築については、オントロジー化の中心的研究と作業を実施しなければならない。従来の考古遺物情報の標準化における体系化や構造を前提として、マイニングから得られた語彙分析や共起ネットワークからの結果と比較・検討して、ArcOnBase知識ベースの実現に向けた知識体系化の研究を進める。その際に地名や時代変遷を考慮することが必要で、メタ情報の在り方、時空間分析の手法を活用し、考古情報におけるメタ情報の知識を総合的に検討して、体系化を実現する。具体的には、遺跡情報データベースにおいて、基礎分析としてのトピックマップによるデータの出現特徴を把握して、知識ベースの体系化・構造化を検討する。 (2)RDF化とLOD設計・実現のための基礎的な実験については、研究資源の記述において、RDF記述の適応を検討する。さらにWeb世界に存在する資源やデータを紐付けし、意味空間を形成するLODを導入する実験を行う。 (3)類似性・特徴パターン探索機能の実現に向けた研究と基礎的な実験および評価では、RDF記述における推論的な手法をも検討するために、クエリー言語としてSPARQL言語をひとつの候補としながらも、あらゆる実現手法について検討・実験する。また、東南アジア考古遺跡DBおよび基本情報の分析についての検証・評価を行い、整合性や問題点を検討する。 (4)考古遺跡情報に関するワークショップ(WS)の開催では、研究進捗状況のWSをタイで開催する。
|
次年度使用額が生じた理由 |
平成26年度における研究目標において、東南アジア考古遺跡データベース(DB)の構築がひとつの目標であり、当初計画では「Myデーターベース」を利用することを検討し、外部委託によるデータベース構築を立てた。しかし、当面の研究過程で必ずしも必要でないこと、およびデータベース構築を遺跡データ分析以降に構築する方が、より効果的であることが分かった。 また、平成27年度において、遺跡データ分析のさらなる増大が予測され、これらへの経費が必要になった。この結果、研究代表者および分担者自身の簡易データベースに切り替えたために次年度使用額が生じた。
|
次年度使用額の使用計画 |
平成26年度に計画した遺跡データ分析に対して、(1)ArcOnBase知識ベース・語彙概念体系の研究と構築についての分析を進めるための経費、(2)RDF化とLOD設計・実現のための基礎的な実験については、研究資源の記述において、RDF記述の適応を検討する。さらにWeb世界に存在する資源やデータを紐付けし、意味空間を形成するLODを導入する実験を行うための経費、(3)類似性・特徴パターン探索機能の実現に向けた研究と基礎的な実験を遂行するための経費、(4)考古遺跡情報に関する現地からの参加も得た国際ワークショップ(WS)の開催(タイ・チェンマイ)により、研究進捗状況を公開するための経費として計画する。
|