研究課題/領域番号 |
20H00022
|
研究機関 | 東京大学 |
研究代表者 |
末柄 豊 東京大学, 史料編纂所, 教授 (70251478)
|
研究分担者 |
遠藤 珠紀 東京大学, 史料編纂所, 准教授 (10431800)
井上 聡 東京大学, 史料編纂所, 准教授 (20302656)
川本 慎自 東京大学, 史料編纂所, 准教授 (30323661)
林 譲 駒澤大学, 文学部, 教授 (00164971)
耒代 誠仁 桜美林大学, リベラルアーツ学群, 准教授 (00401456)
大山 航 東京電機大学, システム デザイン 工学部, 教授 (10324550)
桑田 訓也 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 主任研究員 (50568764)
久留島 典子 神奈川大学, 国際日本学部, 教授 (70143534)
村川 猛彦 和歌山大学, システム工学部, 准教授 (90304154)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
キーワード | 花押 / 筆跡 / ディープラーニング / 歴史的人物情報 / 史料情報 |
研究実績の概要 |
本研究は前年度と同じく次の5つの観点から研究を進めた。 ①データ収集の拡充と収集方針の高度化においては、史料編纂所所蔵の貴重史料のほか、オープンデータとして公開されている各種史料を対象に収集を進めた。当年度収集データは、筆跡が約13万7千件、花押が約1万8千件を数え、その結果、筆跡のデータ総数は約52万件、花押は約11万件を数えている。 ②公開による社会的発信の強化という点では、他機関連携による「史的文字データベース連携システム」の強化に努め、①の新規情報を反映させた。当該システムおよび史料編纂所の「電子くずし字字典データベース」の年間総アクセス数は、100万件を超える規模になっている。また奈良文化財研究所と共同開発する字形解析システム「MOJIZO」のリニューアルを進め、2023年3月に一般への供与を開始した。リニューアルにあっては、深層学習を用いた新たな解析モデルを導入し、精度の向上を図った。なお「花押データベース」についても、年間約35万回のアクセスを数え、筆跡同様に広汎な利用が確認された。 ③人物情報を媒介とした筆跡・花押分析の高度化研究においては、前年度に引き続き、新規登録データの人物情報を、史料編纂所歴史情報処理システム内にある人物レポジトリへと移行し、他データベース群との参照連携を進めた。 ④史料学的情報との統合による筆跡・花押情報の高度利用研究においては、蓄積データを対象とする深層学習を引き続いて実践した。②に掲げたMOJIZOのリニューアルはこの成果によるものである。また、筆跡・花押の分析精度を高めるために、筆路を復元して、電子的に記録するシステムの開発をすすめた。 ⑤史料学的情報との統合による筆跡・花押情報の高度利用研究にあっては、前年度につづき文書様式ごとの字配りや花押配置について特徴を抽出し、電子的なデータとして蓄積することに努めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データ収集対象の拡大・多様化とともに、15万件を超える新規データ登録を実現するなど、当初の予定どおり蓄積を進めている。国内4研究機関と国外1機関で共同構築する「史的文字データベース連携システム」についても、各機関においてデータの増強がなされており、利用も堅調に推移している。史料編纂所から提供する「電子くずし字字典データベース」「花押データベース」の年間利用総数も120万件を突破するなど、人文研究の基礎的ツールとしての認知が広がっている。文理融合による新たな研究活動も、MOJIZOのリニューアル公開などに結実しており、人物情報を媒介とするデータの汎用的利用環境の整備も整いつつある。
|
今後の研究の推進方策 |
筆跡・花押データの集積を推進するとともに、収集対象の一層の多様化を進める。「史的文字データベース連携システム」については、参加連携機関の拡大に積極的に取り組み、あわせて史料編纂所の「電子くずし字字典データベース」の高度化・機能改善に取り組んでゆく。「花押データベース」についても、質量ともにより充実したツールに鍛えることに注力し、筆跡とあわせて汎用的な情報活用のモデル提示を推進してゆきたい。筆跡・花押データを対象とした機械学習・深層学習研究については、学習データの拡張を図りつつ、MOJIZOの解析精度の向上を進め、さらなる高みを目指してゆく。史料学情報と筆跡・花押情報の統合研究においては、文書の料紙や様式と、文字・花押の配置や形状の相関性について、引き続き検証を深めてゆく。
|