2021 Fiscal Year Annual Research Report
Development of Integrated Knowledge through Establishment of an Interactive Research Scheme based on the Open-Data of Research Resources for Wooden Tablets and Related Topics
Project/Area Number |
18H05221
|
Research Institution | Nara National Research Institute for Cultural Properties |
Principal Investigator |
馬場 基 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 室長 (70332195)
|
Co-Investigator(Kenkyū-buntansha) |
中川 正樹 東京農工大学, 学内共同利用施設等, 特任教授 (10126295)
久留島 典子 神奈川大学, 国際日本学部, 教授 (70143534)
高田 智和 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (90415612)
耒代 誠仁 桜美林大学, リベラルアーツ学群, 准教授 (00401456)
山本 和明 国文学研究資料館, 研究部, 教授 (90249433)
山田 太造 東京大学, 史料編纂所, 准教授 (70413937)
笹原 宏之 早稲田大学, 社会科学総合学術院, 教授 (80269505)
大山 航 埼玉工業大学, 工学部, 教授 (10324550)
中村 覚 東京大学, 史料編纂所, 助教 (80802743)
渡辺 晃宏 奈良大学, 文学部, 教授 (30212319)
桑田 訓也 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 主任研究員 (50568764)
山本 祥隆 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 主任研究員 (50610804)
高田 祐一 独立行政法人国立文化財機構奈良文化財研究所, 企画調整部, 主任研究員 (50708576)
星野 安治 独立行政法人国立文化財機構奈良文化財研究所, 埋蔵文化財センター, 室長 (50644481)
上椙 英之 独立行政法人国立文化財機構奈良文化財研究所, 埋蔵文化財センター, 研究員 (50600409)
|
Project Period (FY) |
2018-06-11 – 2023-03-31
|
Keywords | 木簡 / オープンデータ化 / 文字文化 / IIIF / 深層学習 |
Outline of Annual Research Achievements |
機関連携検索ポータルサイト「史的文字データベース連携システム」で公開している「オープンデータに関する仕様(第一版)」をブラッシュアップし、海外機関からの参加を促進させるため、サイト設計仕様書及び検索用API仕様書の英文・中文を公開した。さらに、文字画像検索サービス「MOJIZO」を改良し、従来からのOCRによる検索エンジンに加えて、深層学習による検索を並走させることで、より精度の高い検索システムのβ版を開発した。木簡の高精細画像の整備を行った。 市民参加型の研究を実現するためのツールとして手書き文字画像から運筆情報を取得するためのWEBアプリケーション「ナゾルクン」を一般に公開し、現在の研究部ループ外に蓄積されている知を収集することに着手した。筆順情報は、深層学習(AI)を含む文字自動認識研究を飛躍的に向上させる可能性が強く期待される他、文字そのものの研究を深める重要な情報である一方、これまではデータ化・取得が困難で、研究を発展させる分量を確保することはさらに困難であった。今回、ナゾルクンの開発・公開によって、こうした筆順情報の獲得および獲得作業への参加が飛躍的に容易になり、研究の進展が加速することが期待される。 深層学習を活用して木簡の木目を除去するシステムをさらにブラッシュアップし、画像認識の研究にも援用を開始した。IIIF用の文字画像切出ツールを活用し、新規に約41,000文字(延べ)のデータを作成した。過年度と合わせて合計約180,000文字のデータを作成した。また、文字に関する知識の集積作業として、木簡文字観察記録シートを約12,000文字作成した。また、日中韓簡牘総合研究集会の共催・参加等、中国社会科学院との共同研究強化に取り組み、慶北大学校人文学術院HK事業団、第4回国際学術大会に参加することができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
機関連携検索ポータルサイト「史的文字データベース連携システム」は、サイト設計仕様書を英文・中文で公開できた。これにより、国際的な利活用および新たな機関参加の促進や、東アジアや世界での木簡・文字資料の研究におけるプラットフォームの形成を進めることができた。また、日本、中国、台湾からそれぞれの言語で検索しても同様の結果が表示されるよう異体字処理機能を実装することができた。いずれも連携機関の協力により開発・実装したもので、システム設計書とともにサイト上で公開している。多様なポータルサイトの構築が可能な「開かれた」環境の提供を実現し、より利便性の高い多くの人へサービスを提供することができた。 文字画像検索サービス「MOJIZO」は従来のシステムをよりよくするため研究開発を研究グループ内で討論・検討した成果を開発に結びつけた。運筆情報を取得するための参加誘発型WEBアプリケーション「ナゾルクン」の開発・公開を行ったことで今後の筆順情報の研究データの蓄積が見込まれるとともに、研究成果を広く市民へ公開する目途がたった。 研究資源化を確実に進め、運筆情報を蓄積する観察記録シートの作成を継続的に行ったことで今後DBに活用できる素地基盤が整ってきている。東アジア漢字文化に関する共同研究については日中韓の研究者が一堂に会する慶北大学校人文学術院HK事業団、第4回国際学術大会に参加し報告、討論を行った。 東アジアにおいて多様に展開する「ローカルな漢字文化」に迫る観点での研究内容・成果の共有とブラッシュアップを行うことができ、新型コロナウイルスの影響を受けながらも共同研究を着実に進めることができているため全体としておおむね順調に進展していると判断した。
|
Strategy for Future Research Activity |
機関連携検索ポータルサイト「史的文字データベース連携システム」の参加機関を増やす活動を行っていく。文字画像検索サービス「MOJIZO」β版を改良し、来年度に公開を目指すとともに従来から連携している史料編纂所のDBともさらなる連携を深める。 参加誘発型WEBアプリケーション「ナゾルクン」を更に進化させるために史料編纂所との連携を目指し、さらなるコンテンツの充実と幅広いデータを積み重ねる。研究資源化として目標として掲げている、画像切り出し200,000文字と、観察記録シート140,000文字を最終年度に向けて目指す。 又、従来の継続を進めるとともに、さらなる研究資源化の加速を図る。木簡の調査・整理作業過程の効率化を図るため、整理作業の工程のデジタル化を図る。これにより、従来のアナログで得られていた暗黙知を研究資源化して共有する仕組みの構築を目指す。これらの工程をデジタル化することにより、整理作業で得られるアノテーション情報をボーンデジタルデータとして蓄積する。 国際的な共同研究については中国社会科学院歴史研究院古代史研究所との木簡・監督の共同研究をさらに深化させるため連携を深める。韓国については慶北大学校人文学術院HK事業団の国際学術会議に対面で参加する予定になっており更に連携を進める予定である。又、台湾中央研究院歴史語言研究所との研究協力も定期的な情報交換を継続していく。国内の研究については分担者が主催する研究やワークショップ等で構造を説明して連携先を増やす活動を行う。
|