2022 Fiscal Year Research-status Report
特徴タグ付けを施した問題検索を可能とする和算データベースの構築
Project/Area Number |
21K11899
|
Research Institution | Yamagata University |
Principal Investigator |
脇 克志 山形大学, 理学部, 教授 (30250591)
|
Co-Investigator(Kenkyū-buntansha) |
DIEZ・DONOSO SANTIAGO 山形大学, 理学部, 准教授 (90822015)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | ハフ変換 / 文字認識 / 精度評価 |
Outline of Annual Research Achievements |
山形大学附属図書館に所蔵された144冊の和算書から9450頁分の画像を作成し、図形領域の抽出プログラムと文字認識による文字「今」の抽出プログラムを適用した。 和算書に点在する図形領域をハフ変換を用いた手法で抽出するプログラムの精度評価を行い、その結果を日本数学会秋季大会にて発表した。その中では、誤認識を引き起こす主な要因となる和算書特有の等式表現の問題点を指摘し、この誤認識を少なくする方法としてハフ変換による図形領域抽出の際に、文字部分をマスク処理により消すことを提案している。 これと平行して行っている和算書に含まれるキーとなる文字「今」の抽出とその位置情報を活用して、ハフ変換により得られた図形領域候補から、最も文字「今」に近い図形領域候補を正しい図形領域と認定するプログラムを開発した。このプログラムの精度評価は、3月に行われた日本数学会年会にて発表した。その際に文字「有」もキーとなる文字に加える提案がなされ、プログラム改良に着手した。 これまで開発したプログラムは、Google Colabratoryへの変換により広く一般の研究者にも活用できる形でまとめる作業も進行中である。1月よりこれまで開発した2つのプログラムの精度評価を英文の論文にまとめる作業を分担者と共にスタートさせ、2023年度の夏までの投稿に向けた準備が整った。また、2つのプログラムをPytorchの環境で統合させ1つのプログラムとして高速に処理できる改良にも着手した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
個々のプログラム開発は順調に進んでいる。144冊9450頁の画像への適用にも成功した。しかし、繁雑な作業が多く山形大学附属図書館に所属された431冊の和算書全部にプログラムを適用させるためには、2つのプログラムを統合する必要がある。
|
Strategy for Future Research Activity |
最終年度となる2023年度は、これまでの成果を英文の論文として海外雑誌に公開すると共に、抽出された図形領域での図形認識を進める。更に、認識結果の評価と本研究の目的となる検索可能なデータベースを構築する。
|
Causes of Carryover |
2021年度に新型コロナウィルス予防のため、旅費の支出が出来なかった部分が繰り越されている。2023年度にこれまでの成果を積極的に発表するために活用する。
|
Research Products
(2 results)