研究課題/領域番号 |
21K11899
|
研究機関 | 山形大学 |
研究代表者 |
脇 克志 山形大学, 理学部, 教授 (30250591)
|
研究分担者 |
DIEZ・DONOSO SANTIAGO 山形大学, 理学部, 准教授 (90822015)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 和算書 / 筆文字 / 認識 / 領域 |
研究実績の概要 |
和算データベース構築のため、和算書の中の図形領域の抽出が必要となり、2020度までに2つのプログラムを開発した。プログラムAは、和算書の中に複数存在する直線と円をハフ変換により抽出して、図形領域の候補となる矩形領域を複数列挙することができる。プログラムBは、和算書の各ページに書かれている筆記体の筆文字から「今」の文字を抽出して、ページ番号とページの左上を原点とする座標軸における座標位置を出力するプログラムである。強化学習により既存の文字認識ニューラルネットワークに筆文字の「今」など200種類の筆文字を追加学習させ、適合率91.5%で「今」の文字を抽出できるようになった。 2021年度は、この2つのプログラムの統合を試みてた。このプログラム統合により、プログラムAで抽出した図形領域の候補となる矩形領域と筆文字「今」の相対的な位置関係により、候補となる矩形領域が図形領域となる確率を算出できると期待していたが、統合したプログラムからは大量のエラーコードが発生した。プログラムを解析した結果、それぞれ単独で開発されたプログラム内でのデータの扱い方の違いにより、データの不整合が発生し、それを起因とするエラーであることが判明した。この問題を解決するためには、どちらかのプログラムの書き直すか、または2つのプログラムのデータを翻訳するデータ変換プログラムを開発する必要が発生した。分担者のヤゴ准教授とは、画像処理のプログラムで位相的解析手法を組み込んだ画像認識手法で新たな結果を得て論文として出した。 また、データベース構築に必要なデータベースサーバーを立ち上げた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2つのプログラムの統合により、格段の精度向上が見込まれると思われたが、プログラム間のデータ不整合により図形領域を正確に切り出すまでに至っていない。特に、年度前半に新型コロナで大学内への学生の入出が禁止された影響で、十分な補正・検証作業が進まず。後半にずれ込んでしまった。
|
今後の研究の推進方策 |
地道なデータ修正と精度向上に向けた別のアイデアが必要になっているため、強化学習に使う新たなデータセットを用意することを検討している。また、東北大学の協力のもと、東北大和算データベースの活用するための交渉を行いたい。
|
次年度使用額が生じた理由 |
新型コロナウィルスの蔓延により予定していた出張が取りやめとなった。また、プログラム修正を優先したため、予定していた物品購入は取りやめとした。
|