研究課題/領域番号 |
20K20705
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 専修大学 |
研究代表者 |
松下 知紀 専修大学, その他, 名誉教授 (50115424)
|
研究期間 (年度) |
2020-07-30 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 文字認識 / 初期印刷本 / 手稿写本 / 写本言語の比較 / 西洋手稿写本 / 西洋文字認識 / デジタル写本ライブラリー / 写本の系統性 / 写字生の意図 / 中世英文学 / 人工知能 / 英語初期印刷本 / 中英語方言 / 英語手稿写本 / AI-OCR / AI-OCR / 西洋写本 |
研究開始時の研究の概要 |
1)中世英文学頭韻詩Piers Plowmanには、50の手稿写本と1550年の初期印刷本などが存在する。これらの文字認識は手作業で行うには膨大な時間を要する。近年、量子コンピューターの開発により、多くの分野で大量化、高速化が可能になってきた。本研究は、活字の変異幅が大きいために自動化が難しかった自動認識作業を、正確で高速に行う方法を確立する。凸版印刷のプログラムにより、確実な研究成果を目指す。 2)中世ヨーロッパには無数の手稿写本が収蔵されているが、ほとんど研究対象になってこなかった。ダンテの『神曲』、中世フランス文学の『薔薇物語』などは数百の写本が存在するが、ほとんど研究されていない。
|
研究成果の概要 |
英語の初期印刷本の文字認識は、将来中世英文学の研究に役割が期待される。本研究は、初期印刷本のうち、チョーサーの『カンタベリー物語:岸の物語』とウイリアム・ラングランドの『農夫ピアズ』を例にとり、研究を進めた。AI-文字認識プログラム開発技術が進み、成果が得られた。しかし、印刷の状態が悪く、カスレ文字、文字繋がりなどは誤認識となった。 AI-文字認識: トランスクリブス・プロジェクト, インスブルック大学、オーストリアに参加して、手稿写本の文字認識を行い、公開されているモデルに加えて、特定の写本のために創作されたモデルにより高い認識度を得ることができた。
|
研究成果の学術的意義や社会的意義 |
AI-OCRは現代社会においてDX, IoT分野と同様に社会的貢献を果たすことが可能である。従来、ほとんど研究対象にならなかった初期印刷本、手稿写本の特徴を捉え、比較検討することが可能になる。さらに、Digital Humanitiesという分野において、資料全体を文字イン指揮することにより、重要な研究資料を作成することになる。 さらに、それらを集積して、E-Librayを設立すれば、世界のどの場所にいても、世界で1つしかない資料を調査・研究が可能である。
|