研究課題/領域番号 |
26280122
|
研究機関 | 京都大学 |
研究代表者 |
柴山 守 京都大学, 学内共同利用施設等, 研究員 (10162645)
|
研究分担者 |
森本 晋 独立行政法人国立文化財機構奈良文化財研究所, その他部局等, その他 (40220082)
原 正一郎 京都大学, 東南アジア研究所, 教授 (50218616)
田代 亜紀子 北海道大学, その他の研究科, 准教授 (50443148)
山田 太造 東京大学, 史料編纂所, 助教 (70413937)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 地域情報学 / 情報検索技術 / データ工学 / 東南アジア考古学 / RDF |
研究実績の概要 |
平成28年度の研究においては、(1)ArcOnBase知識ベースの構築:RDF化に伴う東南アジア考古遺跡DBの構築を進めた。そのために各国の遺跡情報データの属性の統一化を検討し、本DBの時空間可視化機能でデータの検証・整合性を確認することを目的にした。特にデータの属性の統一化においては、(a)遺跡・遺物に関する英語に翻訳されたタイ語説明は、キーワードを抽出して、属性を付加して、オントロジー体系化のためのツリー構造表現の実現を目指した(森本、柴山)。(b)遺跡情報のRDF化分析を行なうために、(a)におけるツリー構造を探索するブラウザー“Archaeo Ontology”の性能向上を図り、Linked Open Data (LOD)にもとづく検索を実現するための予備実験を行った。また、後述する検索結果が地図上に可視化される機能を付加した(原、柴山)。(2)東南アジア考古遺跡情報に関するワークショップ(WS)の開催では、全体の研究計画の調整と研究成果を公開する研究会(平成28年6月京都)および国際会議“International Conference on Early State and Cultural Relationship of Mainland Southeast Asia”, organized by CRMA Research Center and EWCC Project国際ワークショップを平成28年11月12日タイ・バンコクにて開催した。(4)遺跡情報は、地域研究におけるフィールドノートの性格と類似した属性が認められる。そのために位置情報とトピックモデルに基づくフィールドノートのビジュアライズ手法、地域研究資料を対象とした時空間情報に着目したデータの構造化などの研究を前年度に引き続いて進め、それらの東南アジア考古遺跡情報への応用について検討した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成28年度における研究目標は、(1) ArcOnBase知識ベースの構築において、形態素解析・語彙分析 、キーワード共起関係などの基本情報の分析にもとづいて、属性定義とそれらを検証する枠組みを確立することであった。そのためには前提として、特に空間情報を伴うタイ国考古情報についての形態素解析を英語に翻訳して、キーワードを抽出、カテゴリー化する基礎的研究を進めた。特に、RDF記述のためにはカテゴリー化されたキーワード情報を探索するブラウザーが必要になり、前年度に開発したブラウザー”Archaeo Ontology”の改良を進めた。本ブラウザーの開発・改良によって、RDF記述のための第一段階となる属性付加が可能になった。当初の予定からみて順調に進捗している。(2)RDF化に伴う基本情報の分析では、基本情報の分析は、DBの属性毎に出現する体言の「値」と「値・値」関係(例えば、地名と遺跡時代の関係、あるいは同義語関係)などの連鎖や共起ネットワークが認識されるようなデータ表現を可能にし、前述のブラウザーで可視化する機能を付加している。そのため、前年度に引き続き、デ ータの正規化のための作業を実施し、時代区分に応じたデータの特徴を把握するするためにGIS分析とマッピングを行なって、データ全体の特徴把握に努めた。本データに最適な語彙の解析手法は、分担者によって示されるトピックマップなどのいくつかの手法の結果を総合的に判断して決定する検討を継続して進めている。また、「値・値」関係のリストのうち、同義語についてシソーラス辞書の構築を開始した。いずれの年次課題についても概ね順調に進捗している。
|
今後の研究の推進方策 |
平成29年度において、ArcOnBase知識ベース・語彙概念体系の研究と構築については、実際にインターネット上に発信されている遺跡情報をも組み込む研究と拡張機能の実現が必要である。従来の考古遺物情報の標準化における体系化や構造を前提として、ブラウザー”ArchaeoOntology”から得られたツリー構造をトピックマップ分析や共起ネットワークからの結果と比較・検討して、ArcOnBase知識ベースの実現に向けた知識体系化の構造設計・プロトタイプ実現とその評価を実施する。その際に地名や時代変遷を考慮することが必要で、メタ情報の在り方、時空間分析の手法を活用し、考古遺跡情報におけるメタ情報の知識を総合的に検討して、体系化を実現する。具体的には、(1)時空間概念にもとづく可視化や文脈依存のキーワード連鎖の可視化のため、付加された属性にもとづくカテゴリー化の最適性について検討する。(2)RDF化とLOD設計・実現のための基礎的な実験については、研究資源の記述において、RDF記述の適応を検討する。さらにWeb世界に存在する資源やデータを紐付けし、意味空間を形成するLODを導入する実験を行う。(3)類似性・特徴パターン探索機能の実現に向けた研究と基礎的な実験および評価では、前年度に引き続き、RDF記述における推論的な手法をも検討するために、クエリー言語としてSPARQL言語をひとつの候補として検討・実験する。 (4)考古遺跡情報に関するワークショップ(WS)の開催では、研究進捗状況を報告するWSをタイで開催する。
|
次年度使用額が生じた理由 |
平成28年度における研究目標において、ArcOnBase知識ベース開発・改善のための東南アジア考古遺跡データベース(DB)による属性付加とカテゴリー化が目標であり、当初計画では新たにRDF化を検討する前年度開発のブラウザー”Archaeo Ontology”の日英版の改善を分担者で進めた。しかし、新たなツール改善に係る経費が当面の予想を下回り、且つ属性付加に関して謝金等による研究資料整理や研究補助による作業を計画したが、極めて専門的知識が要求されることから、分担者間の作業に振り替えた。さらに国際ワークショップの経費も開催場所の検討、関係者の招聘等で節約が可能となり、次年度に繰り越すことで、より効果的な研究が進められることが分かった。 また、平成29年度において、ArcOnBase知識ベース開発のためのさらなる経費の増大が予測され、これらへの対処が必要になった。この結果、研究代表者および分担者自身の次年度使用額への変更が生じた。
|
次年度使用額の使用計画 |
平成28年度に計画した遺跡データのキーワード抽出にもとづく、最適なカテゴリー化のために、(1)ArcOnBase知識ベース・語彙概念体系の研究と構築についての分析を進め、プロトタイプを実現すための経費、(2)RDF化とLOD設計・実現のための基礎的な実験およびプロトタイプ構築・評価では、研究資源の記述において、RDF記述の最適化を検討する。さらにWeb世界に存在する資源やデータを紐付けし、意味空間を形成するLODを導入する実験を行うための経費、 (3)考古遺跡情報に関する現地からの参加も得た国際ワークショップ(W S)の開催(タイ・ナコーンナヨック県など)により、研究進捗状況を公開するための経費として計画する。
|