研究課題
本研究は、木簡に記された中国古代の行政文書の書体分析の手法の開発を目指した。中国古代の秦漢王朝では日常的行政処理はすべて文書によって遂行され、それに伴って日々膨大な量の文書・記録が作成され、行政の実態を知る貴重な一次資料となっていることは周知である。ただ、そのような木簡資料の研究は、記載内容に関心が集中し、その文書・記録がどのように書かれているのかについては殆注目されてこなかった。具体的には、謹直な隷書で書かれているのか、あるいはくずれた草書で書かれているのか、そしてそれが文書・記録の内容とどのような関係があるのかは、未開拓の分野である。個々の木簡の書体を分析するためには、木簡に記された一文字ごとの画像データの集積がまず必要となるが、10万件に達しようとしている秦漢木簡から一文字ずつの画像データを作成することは通常の方法では膨大な手間と時間を要する。そこで本研究では、AIを活用して木簡の赤外線写真から文字を一つずつ自動的に切り出すシステムの開発を試みた。秦漢木簡では、一文字ずつが独立して書写され、いわゆる「つづけ字」となることは原則として存在しない。この特徴に着目して、本研究の文字切り出しシステムは文字間の空白部分を鍵として文字境界領域を認識するアルゴリズムを開発し、実装にこぎ着けた。次いで個々の文字がどれくらい謹直に書かれているのか、つまり文字のくずれ度合いの判定の手法を開発した。この字体分析においては、くずれた文字と謹直な文字の2つの文字群を準備し、深層生成モデルを学習させ、くずれた文字と謹直な文字の差分を計算することでくずれ度合いの算出が可能となった。最終年度には、文字切り出しシステムの精度向上をはかり、その成果を英文論文として投稿し、査読を経て掲載された。
すべて 2023
すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件)
IEICE Trans. Fundamentals
巻: vol. E106-A, no. 11 ページ: 1406-1415
10.1587/transfun.2023SMP0007