2019 Fiscal Year Research-status Report
新約聖書デジタル写本における深層学習による写字識別キュレーションシステムの構築
Project/Area Number |
19K12714
|
Research Institution | Osaka University |
Principal Investigator |
三宅 真紀 大阪大学, 言語文化研究科(言語文化専攻), 准教授 (80448018)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 写本デジタル画像 / 人文情報学 |
Outline of Annual Research Achievements |
本研究は、人文情報学的アプローチにより、新約聖書写本のデジタル画像を活用して、 字形、異読の分析を行い、トランスクリプトからは捉えられない 特徴を抽出する。文字の形状や連なり程度、ならびに、近傍単語との関係性など、伝統的な校訂本における異読情報のアパラトゥスでは確認できない写字や異読の性質を把握することを目的としている。 本年度は、研究体制の整備を行い、研究計画の第1フェーズとして、写本の画像データの収集を中心に研究を進めた。大文字写本の文字の切り出し処理の試行として、写本の検索などの様々な機能が充実しているシナイ写本プロジェクトのサイトを活用した。また、比較対象として、バチカン写本のデジタル画像にもアクセスし、データ収集範囲の検討を進めた。文字の切り出しには、画像処理ライブラリ(OpenCV)を利用して、高精細画像共有規格に準拠したIIIF対応の画像のURLの情報を半自動的に取得するシステムを構築するための準備を進めた。 画像データ分析は、深層学習の手書き認識技術を適用を予定しているが、パイロット研究として、判別学習による字形による写字生の識別学習を行った。また、収集したIII対応デジタル画像のキュレーションシステムを構築するための準備として、利用するプラットフォームについての調査を行なった。 なお、本研究の成果の一部として、Digital Humanities2019の国際会議において、口頭発表で報告している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初の計画では、デジタル画像の収集を、IIIFに対応したデジタル画像の情報を利用して、分析データを整形する予定であった。 一方、分析の対象として考えている写本の一部がIIIF非対応の画像もあることから、分析対象の変更なども検討しているため、研究進度がやや遅れている。
|
Strategy for Future Research Activity |
パイロット分析として、シナイ写本の字体を収集し、写字生の識別分析を進める。 同時に、収集したIII対応デジタル画像のキュレーションシステムに利用するプラットフォームの検討も引き続き行う。
|
Causes of Carryover |
年度末で計画していた、研究打ち合わせや研究成果報告の機会が、新型コロナウィルス感染拡大の影響で、開催中止となったため。
|
Research Products
(1 results)