研究課題/領域番号 |
17K03049
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
史学一般
|
研究機関 | 中京大学 |
研究代表者 |
山田 雅之 中京大学, 工学部, 教授 (90262948)
|
研究分担者 |
目加田 慶人 中京大学, 工学部, 教授 (00282377)
寺沢 憲吾 公立はこだて未来大学, システム情報科学部, 准教授 (10435985)
川嶋 稔夫 公立はこだて未来大学, システム情報科学部, 教授 (20152952)
長谷川 純一 中京大学, 工学部, 教授 (30126891)
檜山 幸夫 中京大学, 社会科学研究所, 特任研究員 (40148242)
東山 京子 中京大学, 社会科学研究所, 研究員 (80570077)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2018年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2017年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 史料研究 / 近代公文書 / データセット開発 / 手書き文書認識システム |
研究成果の概要 |
近代の手書き文字による公文書を、コンピュータが自動的に解読するシステムの実現を目指し、その基盤となるデータセットと要素技術を開発した。題材として台湾総督府文書を利用し、約1700ページ、37万個の手書き文字に関する字形・字種の情報を有するデータセットを開発した。また、深層学習に基づく文字切り出し技術と個別文字認識技術を開発した。台湾総督府文書を対象とした実験では、それぞれの技術の精度は95%と89%に達した。
|
研究成果の学術的意義や社会的意義 |
近代公文書は近世古文書の流れを汲む近代古文書のため解読は容易ではなく、その自動解読システムを開発できれば、広く一般の国民や外国人研究者が近代公文書を利用できるようになる。本研究が開発したデータセットと要素技術は自動解読システム開発のための基盤となるものであり、また、文書認識技術の研究分野の発展に寄与するものである。
|