2020 Fiscal Year Research-status Report
新約聖書デジタル写本における深層学習による写字識別キュレーションシステムの構築
Project/Area Number |
19K12714
|
Research Institution | Osaka University |
Principal Investigator |
三宅 真紀 大阪大学, 言語文化研究科(言語文化専攻), 准教授 (80448018)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 写本デジタル画像 / 人文情報学 |
Outline of Annual Research Achievements |
本研究は、人文情報学的アプローチにより、新約聖書写本のデジタル画像を活用して、 字形、異読の分析を行い、トランスクリプトからは捉えられない特徴を 抽出する。文字の形状や連なり程度、ならびに、近傍単語との関係性など、伝統的な校訂本における異読情報のアパラトゥスでは確認できない写字や異読の性質を把握することを目的としている。 今年度は、高精細画像共有規格に準拠したIIIF対応の画像のURL の情報から、個別の手書きの文字ファイルを半自動的に取得するスクリプト作成を中心に作業を進めた。 具体的には、バチカン写本の新約聖書福音書の範囲に対して、文字の切り出しを行い、学習用のデータセットの作成を試みた。 当初は、バチカン写本の字体との比較として、シナイ写本を使用する計画であったが、比較対象の箇所のシナイ写本の一部がIIIFに対応していないデジタル画像であるため、研究計画の一部を変更し、バチカン写本だけで分析可能な研究候補の洗い出しを行なった。まだ、予備調査が続いている段階であるが、次年度に、画像データによる文字の一致部分の切り出しの可能性について、検討する予定である。この手法は、共観福音書の並行記事箇所や相互引用箇所の特定に拡張することもでき、研究範囲に広がりと持たせることができると考えている。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
当初の計画では、 シナイ写本のデジタル画像の収集を先に進め、パイロット研究の分析データとする予定であったが、IIIF非対応の画像データが混在するため、パイロット研究対象の写本をIIIF対応した写本へと変更したため、先行研究の資料調査等に時間がかかっているため、研究進度が遅れている。
|
Strategy for Future Research Activity |
新たなパイロット分析の候補として、IIIFに対応したデジタル画像の情報を収集し、写字生の識別分析を進める。 同時に、収集したIII対応デジタル画像のキュレーションシステムに利用するプラットフォームの検討も引き続き行う。
|
Causes of Carryover |
今年度は、新型コロナウィルス感染拡大の影響で、国内・海外の旅費を執行できなかったため、次年度使用額が生じた。次年度も旅費予算に関しては、引き続き執行がしにくいことが予想されるため、参考図書などの資料収集の予算として、使用する予定である。
|