新約聖書デジタル写本における深層学習による写字識別キュレーションシステムの構築

研究課題

研究課題/領域番号	19K12714
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分90020:図書館情報学および人文社会情報学関連
研究機関	大阪大学
研究代表者	三宅真紀大阪大学, 大学院人文学研究科(言語文化学専攻), 准教授 (80448018)
研究期間 (年度)	2019-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円) 2022年度: 520千円 (直接経費: 400千円、間接経費: 120千円) 2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円) 2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード	IIIF / 深層学習 / 写本デジタル画像 / 人文情報学 / 新約聖書写本
研究開始時の研究の概要	本研究は、人文情報学的アプローチにより、新約聖書写本のデジタル画像を活用して、字形および異読の分析を行い、文字起こし（トランスクリプト）データからは捉えられない特徴を抽出する。写本の画像データは、高精細画像共有規格に準拠してオープン化された情報を活用し、画像データの切り取り、分析データの収集を行う。分析解析の結果は、国際標準規格に準拠したデータ形式で実装し、共有化写本デジタル画像による仮想コレクションシステムを構築する。最終的に、新約聖書の写字識別キューレーションシステムとして、本研究成果を公開する。
研究成果の概要	本研究は、IIIFに対応した新約聖書大文字写本のデジタル画像を活用し、写字の字形特徴を分析した。バチカン写本においては写字の形状属性による識別精度の違いについて観察し、シナイ写本では字形が似ている文字と異なる文字のデータセットを作成した。異常検知手法であるOne-Class Deep SVDDを用いて深層学習を適用した結果、基準の文字と字形の似た文字については、入出力の差分と異常スコア分布の重なりが確認された。また、異常スコアが高い画像には、インクの濃さや隣接文字の一部が混入しているケースが多いことから、字形とは別の要素が識別に関与している可能性が示唆された。
研究成果の学術的意義や社会的意義	人工知能分野の深層学習による写字識別のアプローチは、聖書学の伝統的正文批判研究や神学的解釈の固定概念からとは異なる観点を可能にし、客観的情報による新たな特徴の発見の可能性がある。高精細画像共有規格に準拠したIIIF対応の写本のデジタル画像を活用は、既存のデジタル資料の共有・再活用の実践的研究として意義があり、デジタル・ヒューマニティーズ分野の学際的研究の進展に貢献する。

報告書

(6件)

研究成果
(1件)

すべて学会発表 (1件) (うち国際学会 1件)

[学会発表] Applying Measures of Lexical Diversity to Classification of the Greek New Testament Editions2019
- 著者名/発表者名
  MIYAKE Maki
- 学会等名
  DH2019
- 関連する報告書
  2019 実施状況報告書
- 国際学会