Project/Area Number |
20H00017
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 2:Literature, linguistics, and related fields
|
Research Institution | International Research Center for Japanese Studies |
Principal Investigator |
関野 樹 国際日本文化研究センター, 総合情報発信室, 教授 (70353448)
|
Co-Investigator(Kenkyū-buntansha) |
原 正一郎 京都大学, 東南アジア地域研究研究所, 名誉教授 (50218616)
山田 太造 東京大学, 史料編纂所, 准教授 (70413937)
森 信介 京都大学, 学術情報メディアセンター, 教授 (90456773)
後藤 真 国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (90507138)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥44,200,000 (Direct Cost: ¥34,000,000、Indirect Cost: ¥10,200,000)
Fiscal Year 2023: ¥8,970,000 (Direct Cost: ¥6,900,000、Indirect Cost: ¥2,070,000)
Fiscal Year 2022: ¥12,480,000 (Direct Cost: ¥9,600,000、Indirect Cost: ¥2,880,000)
Fiscal Year 2021: ¥12,220,000 (Direct Cost: ¥9,400,000、Indirect Cost: ¥2,820,000)
Fiscal Year 2020: ¥10,530,000 (Direct Cost: ¥8,100,000、Indirect Cost: ¥2,430,000)
|
Keywords | 時間情報 / GIS / Digital Humanities / Linked Open Data / 歴史資料 |
Outline of Research at the Start |
情報システム上では、時間や空間は緯度・経度や年月日で表される。このため、多くの研究者が歴史資料などで使われる地名や時代名などの表現を緯度・経度や年月日に置き換えるのに苦労を重ねてきた。本研究では、これらの地名や時代名をそのまま情報システムで扱うための仕組みを開発する。これにより、緯度・経度や年月日を用いずに、地名や時代名を使った検索や可視化・解析が可能になる。これを実現するため、既存の歴史資料を用い、地名や時代名などの表現を緯度・経度や年月日を結びつけ、両者を仲立ちする仕組みを構築する。
|
Outline of Annual Research Achievements |
・時空間範囲名の抽出:自然言語処理技術を使い、新聞記事を材料に任意のできごとに関連した固有表現の抽出やそのできごとが継続した時間範囲の推定を行う手法を構築・検証した。また、できごとの多くは単純な名称(「~事件」「~戦争」など)とはならず、一定の文章表現(「〇〇が××した」など)となるため、それらを時間範囲名として時間範囲と結び付けて扱うための課題と方策を整理した。 ・あいまいな時間のデータ化:これまでに構築したHuTime Ontologyなどのあいまいな時間を扱うため理論や技術に基づいて本研究で用いるデータスキーマの設計を進め、試験的なデータの入力を開始した。データスキーマの設計に際しては、新たに立ち上がった歴史時間のデータ化に関する国際的な研究グループとの協議を開始し、データの相互変換やLinked Data等による連携も模索することとした。 ・時空間座標の付与:時間座標の付与に用いる暦APIについて、中国暦を扱うための機能追加や1つの日付表現に対して複数の変換結果の候補がある場合の出力に対応する等の機能強化を進めた。 ・データの公開に向けた準備:Webブラウザ上で動作する時間情報システム Web HuTime を本研究の成果公開のユーザインタフェースとして活用するため、その機能やAPI仕様の見直し、年表表示の表現力の強化、検索機能の追加、年表やグラフを跨ぐカーソル表示機能の追加等の改修を行った。さらに、将来的な活用を見据えて、コード全体を新しい言語仕様(ECMAScript 2015以降)に書き換えた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
Web HuTimeや暦APIの機能追加や改修が進むなど、データ構築や公開に関する環境整備が進んだ。一方でデータ構築そのものについては、データスキーマの構築や試験的なデータ入力が始まったものの、本研究のデータについて、新たに立ち上がった歴史時間のデータ化に関する国際的な研究グループとの連携が必要になったことなどで、データスキーマが確定できず、やや遅れている。
|
Strategy for Future Research Activity |
データスキーマを海外のデータとの連携も可能にした形で確定させるとともに、試験的なデータ入力の実績を踏まえて、遅れているデータ構築を進める。また、空間情報についても歴史地名辞書との連携を含めた検討を開始する。データ公開に向けては、公開用サーバに改修したWeb HuTime等のシステムを導入したり、データ取得用のAPIやRDFストアとしての機能を実装するなど、実運用に向けた作業を進める。
|