2010 Fiscal Year Annual Research Report
和文かな書体の自動的な特長量抽出と定量的評価の研究
Project/Area Number |
21700113
|
Research Institution | Hiroshima University |
Principal Investigator |
鈴木 俊哉 広島大学, 情報メディア教育研究センター, 助教 (70311545)
|
Keywords | フォント / 書体 / 字形 / 標準化 |
Research Abstract |
第二年度は、アウトラインフォントのデータを念頭に置いた特徴点抽出手法 A)制御点分析手法:フォント中のベジエ曲線制御点の内分点を検査することで検出する B)細線化手法:ベジエ曲線により定義される閉領域の塗りつぶし処理を調整することで検出する C)ベクトル解析手法:ベジエ曲線からの回転寄与(rotation)を計算することで検出する のうち、細線化手法に基づくグリフ抽出を重点的に行った。これを元に文字符合の国際標準化資料からのグリフ抽出および比較手法を検討した。細線化の線画認識について、字書類の検字表からのグリフ抽出などの前処理への適用を計ったため、実装は第二年度中には完了しなかった。 また、初年度の制御点分析手法の適用例として、国際規格票中の漢字グリフの同定試験を行ったところ、PDF生成プロセスによって同一のベジエ曲線の様々な表現形態(曲線座標を全て絶対座標で指定するか・直前の制御点に対する相対値で表現するか、また、パスの終点を明示的に開始点に置くか、自動閉鎖によって閉じさせるか)が現れるため、単純な描画命令比較では同定できない問題が明らかとなった。この問題に関して、PostScript Type1描画命令のインタプリタのスタック状態を比較することにより、ベジエ曲線表現方法の影響を排除できることを明らかにしたが、TrueTypeヒント命令による座標点移動の影響は完全には排除できておらず、完全な自動同定は完成していない。TrueTypeヒント命令による書体・字形の変化の解析は今後の課題となっている。 国際標準化への活動としては、初年度に引き続き、曲線を主体とする金文・篆文字形を直線のストロークに置き換えて明朝化する際、屈曲点の解釈の違いから統合不能な字書字形が造字されて国際標準に提案されている問題を議論した。 また、古漢字の標準化作業においてグリフ切り出し手法の適用によるデータ収集を進めている。
|