研究課題/領域番号 |
14550369
|
研究機関 | 尚美学園大学 |
研究代表者 |
恩田 憲一 尚美学園大学, 芸術情報学部, 助教授 (60310257)
|
研究分担者 |
春口 巌 尚美学園大学, 芸術情報学部, 助教授 (50327144)
斉藤 英雄 慶應義塾大学, 理工学部, 助教授 (90245605)
小沢 愼治 慶應義塾大学, 理工学部, 教授 (70051761)
|
キーワード | デジタルアーカイブ / 構造記述 / 領域分割 / 色空間 |
研究概要 |
本研究では、デジタルアーカイブの対象として聖書や楽譜、家系図等、明確な構造と意味情報が含まれるコンテンツを取り扱う。これら貴重書のデジタルアーカイブに際しては、単にイメージのハンドリングに留まる事無く、そのイメージの中から構造的な記述を抽出し、ページ構成やレイアウト、印刷技法などの書誌学的なコンテンツ分析および、それらの分析結果をキーとした高次なインデックスによる検索、そしてインターネット上でのイメージ再現を考慮する事により、構造記述型デジタルアーカイブシステムの実現を目指している。したがって、ドキュメントの構造を自動抽出する研究は、その意味情報の抽出と利用という次の段階の研究課題へ向かう足がかりとなる、重要な基盤技術であると考えている。 稀覯書を租にモデル化すると、背景と文字、または背景と記号といった、本質的には2値画像と見なせる領域をベースとして、その上に挿絵領域がカラー画像として重畳されていると考える事が出来る。そこで、HSL空間での各領域に現れる特徴的な色分布を分析する事により、色空間でのクラスタリングを主とし、空間的な情報を従として、文字/記号領域と背景領域そして挿絵などのカラー領域の三者を判定分離するアルゴリズムを構築した。このようにして3つのカテゴリーへ分離した後、文字/記号領域の個々のシンボル画像に対しては、連結したシンボルの分離と文字/記号認識を融合した記号化アルゴリズムが必要となるが、そのための予備実験として、対象となる稀覯書や楽譜からランダムサンプリングしたページから得られた文字/記号領域を用いて、シンボルの特徴量解析を行い、記号ごとの特徴量を分析した。
|