新約聖書デジタル写本における深層学習による写字識別キュレーションシステムの構築
Project/Area Number |
19K12714
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | Osaka University |
Principal Investigator |
三宅 真紀 大阪大学, 大学院人文学研究科(言語文化学専攻), 准教授 (80448018)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Project Status |
Completed (Fiscal Year 2023)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2022: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2021: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2020: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2019: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | 写本デジタル画像 / 人文情報学 / 新約聖書写本 / 深層学習 |
Outline of Research at the Start |
本研究は、人文情報学的アプローチにより、新約聖書写本のデジタル画像を活用して、字形および異読の分析を行い、文字起こし(トランスクリプト)データからは捉えられない特徴を抽出する。写本の画像データは、高精細画像共有規格に準拠してオープン化された情報を活用し、画像データの切り取り、分析データの収集を行う。 分析解析の結果は、国際標準規格に準拠したデータ形式で実装し、共有化写本デジタル画像による仮想コレクションシステムを構築する。最終的に、新約聖書の写字識別キューレーションシステムとして、本研究成果を公開する。
|
Outline of Annual Research Achievements |
本研究は、新約聖書のIIIFに準拠したデジタル写本データを活用し、伝統的な校訂本における異読情報が記載されたアパラトゥスでは読み取れない、文字の形状や連なり状態、ならびに近傍単語との関係性など写字の特徴を調査することを目的としている。 最終年度は、昨年度の成果物であるIIIF対応画像一括取得スクリプトを利用し、Jupyter notebook上で、取得後の写字の切り出し画像の確認、および、切り出し範囲の修正を行い、重点的に分析用画像データの整形に取り組んだ。また、写字生の特徴を調査することを目的として、シナイ写本でIIIF対応箇所(Leipzig大学図書館所蔵分)のうち、Codex Sinaiticus Projectにおいて写字生B1と識別されているQuire47(folio 1r)からQuire 49(folio 5r)の範囲の文字を、追加データを収集した。前年度の字形分析で使用したデータは、写字生Aと識別されている画像データであるため、今年度の取得データと合わせることで、異なる写字生による文字の形状の違いを調査する準備を整えることができた。
|
Report
(5 results)
Research Products
(1 results)