研究課題/領域番号 |
22K12736
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 芝浦工業大学 |
研究代表者 |
鈴木 徹也 芝浦工業大学, システム理工学部, 教授 (00323824)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2024年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2023年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | 文書画像解析 / 歴史的文書 / データ合成 / 深層学習 |
研究開始時の研究の概要 |
計算機による歴史的文書(古典籍、古文書など)の翻刻支援の研究では、文書画像中の文字の位置検出と文字のパターン認識とについての研究は進んでいる。しかし検出した各文字の読み順の決定法についてはあまり進んでいない。文字の位置検出に加えて、行の抽出と抽出した行の読み順の決定(順序付)ができれば、検出した文字の読み順が決定できると考えられる。 本研究課題では、深層学習を利用した古典籍の文書画像解析手法(行の抽出法、行の順序付け法)を考案および実装した上で評価する。また、深層学習に必要な学習データの合成法についても考案および実装した上で評価する。
|
研究実績の概要 |
計算機による歴史的文書(古典籍、古文書など)の翻刻支援の研究では、文書画像中の文字の位置検出と文字のパターン認識とについての研究は進んでいる。しかし検出した各文字の読み順の決定法についてはあまり進んでいない。文字の位置検出に加えて、行の抽出と抽出した行の読み順の決定(順序付)ができれば、検出した文字の読み順が決定できると考えられる。
このような背景から本研究は次の2つを目的とする。(1)古典籍を対象とした文書画像解析(行抽出、行の順序付)に利用する深層ニューラルネットワークの構成を提案し、その評価を行うこと。(2)深層ニューラルネットワークのための学習データの合成法を提案し、その評価を行うこと。
2022年度の進捗は次の通りである。まず研究課題を遂行するための計算機環境の準備(ハードウェアの調達とソフトウェアのインストール)を行った。次に若干のソフトウェア開発を行った。具体的には、研究代表者らが過去に実装した注釈付き文書画像合成システムを修正した。これによって、対象とする古典籍に類似した文書画像とそのメタデータ(行の中心線画像)とを大量に合成できるようになった。さらに、そのシステムで合成した文書画像と行の中心線画像とを用い、行抽出のためのセマンティックセグメンテーションの予備的な実験を行った。本研究課題に関連する情報を収集するために、いくつかの研究集会に参加した。残念ながら研究成果の発表には至らなかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
研究代表者の家庭の事情により研究に費やす時間を十分に確保できなかった。その結果、計画通りに研究を進めることができなかった。
|
今後の研究の推進方策 |
研究のための時間を確保できる見通しが立ったので、2023年度は研究計画通り古典籍の文書画像からの行抽出法を提案し評価することを目指す。
|