研究課題/領域番号 |
17K19974
|
研究機関 | 京都大学 |
研究代表者 |
小山田 耕二 京都大学, 学術情報メディアセンター, 教授 (00305294)
|
研究期間 (年度) |
2017-06-30 – 2019-03-31
|
キーワード | 三次元データ / 等値面表示 |
研究実績の概要 |
本研究では、ページを剥がせなくなった状態の冊子体に対して、三次元データ可視化技術を利用したページ情報抽出技術を開発する。H29年度に実施した研究の成果について、冊子体から空間や線吸収率において十分な解像度をもつ三次元データを生成するための準備を行った。
低コストのX線管やX線検出器を使ったイメージングでは、十分な空間解像度のボリュームデータを取得することができない場合がある。この場合、ソフトウェアの利活用により、ハードウェアの性能を補償する必要がある。具体的には、冊子体に対して、二種類(高解像度局所撮影、低解像度全体撮影)の投影データを用いて,関心領域における画像再構成を行った。空間分解能とは,二つの物体を識別可能な最小の距離,と定義される.したがって,冊子体を構成するページ情報が再構成画像中で識別可能かどうかによって,空間分解能の評価を行う。空間分解能とは,二つの文字またはページ領域を識別可能な最小の距離と定義する.
吸収型のX線CTでは、紙とインクの線吸収率に十分な差が出ない場合を想定する。このような場合、インク領域と紙領域との違いは、ほとんど認識されない状況が発生する。このような場合、線吸収率におけるコントラストを高めるために、X線の波長を可能な範囲で変化させ、与えられた紙とインクのペアにおいて、コントラストを最大化する波長を特定する。市場で流通する印刷紙・インクにおける線吸収率の波長依存特性を事前に作成し、印刷紙・インクの組み合わせ毎にコントラスト最大化させる波長を特定するための準備を行った。この組み合わせは有限なので、コントラスト最大化波長の候補リストを作成し、これを保存しておくようにする。冊子体からボリュームデータを作成するときに、このリストから順にX線波長を取り出し、コントラストを最大化する波長を選び出すことができるかどうかを確認するための準備を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
学術的問い「X線CT装置により、冊子体ボリュームデータが生成できるのか?」対して、「空間や線吸収率において超解像技術が開発できるなら、X線CT装置により、冊子体のボリュームデータが生成できる。」という仮説を構築し、その検証のために立案した二つの実験計画において、その有用性を確認するためのX線CT装置を設置し、基本的実験を終了させた。具体的には、計画1:超解像技術を使った高解像度化技術の開発について、冊子体を構成するページ情報が再構成画像中で識別可能かどうかによって,空間分解能の評価を行った。空間分解能とは,二つの文字またはページ領域を識別可能な最小の距離と定義する.また、計画2:吸収率データにおけるコントラスト増幅について、X線の波長を可能な範囲で変化させ、与えられた紙とインクのペアにおいて、コントラストを最大化する波長を特定した。
|
今後の研究の推進方策 |
学術的問い「冊子体ボリュームデータから印字情報付きのページ面を等値面として抽出できるのか?」対して、「潜在的な意味情報を使ったセグメンテーション技術を開発できるなら、冊子体ボリュームデータから印字情報付きのページ面を等値面として抽出できる。」という仮説を構築し、その検証のために立案した二つの実験計画 計画2-1 ページ領域の空間セグメンテーション技術の開発 空気領域が徐々に狭くなり、厚さゼロとなってしまう接触点を特異点として抽出し、連続するページ面が交差しないという制約、一種の潜在的な意味情報を課すことにより、迷走しないような等値面抽出手法を開発する。何も印刷されていない冊子体からX線CTデータを取得し、正しくページ領域が抽出されているかどうかを確認する。 計画2-2 文脈情報を使った文字認識技術の開発 文字単位での正確な認識に加えて、生成文における意味的な自然さを実現するための技術を開発し、ペアのページにおいて、正しい文が抽出されているかどうかを確認する。 において、その有用性を確認するために必要となる画像セグメンテーション技術や自然言語処理技術の整備を行っている。
|
次年度使用額が生じた理由 |
三次元CT撮影装置レンタルにおいて、学内設置場所の選定に時間がかかり、今年度設置となったため、レンタル費相当分が差額となってしまった。この経費を今年度はじめにすみやかに執行し、当初計画を進めていく予定である。
|