研究課題/領域番号 |
19K01044
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分03030:アジア史およびアフリカ史関連
|
研究機関 | 関西大学 |
研究代表者 |
藤田 高夫 関西大学, 文学部, 教授 (90298836)
|
研究分担者 |
吉田 壮 関西大学, システム理工学部, 准教授 (70780584)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2020年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2019年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 木簡 / 居延漢簡 / 書体分析 / 文字切り出し / 文字のくずれ度合い / 隷書体 / 草書体 / 同筆と異筆 / 木簡文字検出 / 字体変換 / 都尉府 / 章草体 / 手書き / AI / 行政文書 / 文字の謹直さ / 同筆 / 文字切りだし |
研究開始時の研究の概要 |
本研究課題は、中国漢代の行政機構研究の一次資料である簡牘文書の書体分析の手法確立を目指すものである。ここでいう書体とは文字の「書きぶり」を意味する。多数の漢代簡牘を観察すれば、書きぶりの謹直さにはかなりの幅があることが容易に見て取れるが、字体の崩れ方と文書の性格との間の関係性は等閑視されてきた。このような文字の謹直度が、文書行政の中でその文書が持つ意味とどのように関連するのかを解明し、行政の現場で文書作成の実態に切り込むことが本研究の最終的目的である。
|
研究実績の概要 |
本研究は、木簡に記された中国古代の行政文書の書体分析の手法の開発を目指した。中国古代の秦漢王朝では日常的行政処理はすべて文書によって遂行され、それに伴って日々膨大な量の文書・記録が作成され、行政の実態を知る貴重な一次資料となっていることは周知である。ただ、そのような木簡資料の研究は、記載内容に関心が集中し、その文書・記録がどのように書かれているのかについては殆注目されてこなかった。具体的には、謹直な隷書で書かれているのか、あるいはくずれた草書で書かれているのか、そしてそれが文書・記録の内容とどのような関係があるのかは、未開拓の分野である。 個々の木簡の書体を分析するためには、木簡に記された一文字ごとの画像データの集積がまず必要となるが、10万件に達しようとしている秦漢木簡から一文字ずつの画像データを作成することは通常の方法では膨大な手間と時間を要する。そこで本研究では、AIを活用して木簡の赤外線写真から文字を一つずつ自動的に切り出すシステムの開発を試みた。秦漢木簡では、一文字ずつが独立して書写され、いわゆる「つづけ字」となることは原則として存在しない。この特徴に着目して、本研究の文字切り出しシステムは文字間の空白部分を鍵として文字境界領域を認識するアルゴリズムを開発し、実装にこぎ着けた。 次いで個々の文字がどれくらい謹直に書かれているのか、つまり文字のくずれ度合いの判定の手法を開発した。この字体分析においては、くずれた文字と謹直な文字の2つの文字群を準備し、深層生成モデルを学習させ、くずれた文字と謹直な文字の差分を計算することでくずれ度合いの算出が可能となった。 最終年度には、文字切り出しシステムの精度向上をはかり、その成果を英文論文として投稿し、査読を経て掲載された。
|