2020 Fiscal Year Research-status Report
Extraction of page datasets from 3-D CT data of booklets from Laplace equation
Project/Area Number |
20K20632
|
Research Institution | Kyoto University |
Principal Investigator |
小山田 耕二 京都大学, 学術情報メディアセンター, 教授 (00305294)
|
Project Period (FY) |
2020-07-30 – 2023-03-31
|
Keywords | 視覚的分析 / ラプラス方程式 / 可視化 |
Outline of Annual Research Achievements |
ここ数年、もろくなっており、開くことができない古文献の解読に関して、CTスキャン装置を使った研究事例が発表されている。また、つい最近、イタリアのポンペイで数千人の死者を出したベスビオ火山噴火の灰に埋もれていた古文献に対して、位相型CTスキャンデータや「シンクロトロン」という粒子加速器を用いたデジタル化手法が提案されている。デジタル化された文献の分析手法については、手つかずであり、我々は、文献を冊子体と仮定した分析手法の研究開発を推進している。
古文献に傷をつけることなく、ページごとの文章情報を読み取る技術はこれまでに提案されておらず、本研究が世界に先駆けて実施する初の取り組みとなる。近年では、文献より断片的に文字情報を抽出する技術報告があった。これらの方法では、文献に書かれていた文字情報を抽出できたとされるが、単語や文については、抽出できておらず、ページ領域を正確に抽出できていなかったことが原因であった。
この問題を解決するために、本研究では、ラプラス方程式を使って、三次元CT装置を使って取得された冊子体三次元画像(図1参照)からページデータを効果的に抽出する手法を開発し、その有用性を確認する。学術的問いは、「どのようにすれば、冊子体から生成された三次元画像から正しくページ情報を抽出することができるか?」である。この問いに対する仮説は、「冊子体の各ページ面を等値面とするようなスカラ場を適切に生成することができれば、三次元画像から正しくページ情報を抽出することができる」とし、その有用性を検証するためのシステム環境を構築した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究提案「冊子体の各ページ面を等値面とするようなスカラ場を適切に生成することができれば、三次元画像から正しくページ情報を抽出することができる」の有用性を検証するためのシステム環境を構築した。ページ番号に対応するスカラ場の生成手段として、電子部品であるコンデンサ内部の電位の計算でよく用いられ、かつ厳密解が知られているラプラス方程式を取り上げた。ラプラス方程式の厳密解の未定係数については、境界条件から決定されるので、Webアプリとして開発した対話環境において、十分な数の冊子体内部点におけるページ番号と三次元座標を指定する。このようにして決められたラプラス方程式の厳密解を計算してスカラ場を生成し、ページ面を等値面として抽出し、その等値面にソリッドテクスチャにロードした文献の三次元画像をマッピングすることができた。
|
Strategy for Future Research Activity |
来年度は、今年度開発した対話環境において、ページ番号と三次元座標を指定する冊子体内部点の数における基準について検討を行う。対話環境を用いて構築するスカラ場の適切さに関しては、未定係数があらかじめ決められたラプラス方程式の厳密解をつかって、三次元画像を生成し、この対話環境を通じて決定された係数との差を定式化し、その値(誤差)がゼロに近ければ近いほどより適切なスカラ場が生成されたと解釈する。また、対話環境を通じて指定する内部点の個数が増えると、その誤差が小さくなるのかどうかを確認する。この結果を用いて、スカラ場を生成するために必要となる指定すべき内部点数の基準を決めることができる。
|
Causes of Carryover |
コロナ禍の状況で研究発表の機会が著しく減少したため
|