2022 Fiscal Year Annual Research Report
Extraction of page datasets from 3-D CT data of booklets from Laplace equation
Project/Area Number |
20K20632
|
Research Institution | Kyoto University |
Principal Investigator |
小山田 耕二 京都大学, 学術情報メディアセンター, 教授 (00305294)
|
Project Period (FY) |
2020-07-30 – 2023-03-31
|
Keywords | 可視化 |
Outline of Annual Research Achievements |
本研究の目的は、ラプラス方程式を使って、三次元CT装置を使って取得された冊子体三次元画像からページデータを効果的に抽出する手法を開発し、その有用性を確認することである。学術的問いは、「どのようにすれば、冊子体から生成された三次元画像から正しくページ情報を抽出することができるか?」である。この問いに対する仮説は、「冊子体の各ページ面を等値面とするようなスカラ場を適切に生成することができれば、三次元画像から正しくページ情報を抽出することができる」である。冊子体は、インクで印字された複数枚のページを綴じたもので、ページを捲らずに冊子体を構成するページを表示することを大きな目標とした。
研究計画を以下に述べる。まず、スカラ場の生成手段として取り上げるラプラス方程式の厳密解の未定係数については、対話環境において指定する十分な数の冊子体内部点におけるページ番号と三次元座標を使って、同定する。このようにして決められたラプラス方程式を計算してスカラ場を生成し、ページ面を等値面として抽出し、その等値面に三次元画像をマッピングする。
次に、等値面にマッピングされた画像は、ページ情報を適切に表していない場合が想定される。正しくページ面がマッピングされた等値面、そうでない等値面を画像データとして複数用意し、目視でタグ付けを行う。このタグ付き画像に対して、CNNを使って、教師付き学習を行い、画像分類器を構築する。この画像分類器を使えば、冊子体の1ページ分が適切にマッピングされているかどうか(MA : Mapping Appropriateness)が判定可能になる。次に、ページ数を順に変化させて得られた等値面すべてが適切にページ情報をマッピングされるように未定係数を最適化した。
|