2015 Fiscal Year Research-status Report
個性と自然な字体の揺らぎを合わせ持つ手書き文字・毛筆文字の自動生成
Project/Area Number |
15K00242
|
Research Institution | The University of Aizu |
Principal Investigator |
愼 重弼 会津大学, コンピュータ理工学部, 准教授 (40315677)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 筆跡 / 文字生成 / 個人性 / 変異性 / 拡張性 / 筆者識別 / 毛筆文字の合成 |
Outline of Annual Research Achievements |
本研究は、個人の筆跡をモデル化した文字生成手法に関するものである。 初年度は、手書き文字生成の拡張性の実現を目標に研究を遂行した。現在までのモデルは、人が書いた文字と異なる文字種については適用できない。そのために、ストロークモデルと画間相互モデルの組合せで文字を生成する手法を採用することにより、拡張性を実現した。 本研究チームは最近、個人ごとの特性にあたる(1)個人性と、個人の筆跡の揺らぎにあたる(2)変異性を持つ手書き文字を、人工的に生成することに成功した。これを踏まえ、本課題に関して3つの目標を設定した。第一に、より便利なシステムの実現を目指して、実際に人が書いたことがない文字もサンプルから合成できる手法((3)拡張性)を開発すること。第二に、生成された文字を活用して、オンライン筆者識別の性能を向上させること。 第三に、先に挙げた3つの性質を備えた人工的な毛筆文字を合成することである。 人間が、自分自身の書いた文字を認識する認知能力は、漢字の場合、約77%であることが実験により分かった。言い換えれば合成した文字の認識率がこのレベルに到達すれば、完全に本物として認識できることになる。本研究チームは入力文字サンプルと同一文字種を生成する場合において、同等の認識率の達成に成功した。他の研究では認識率として個人性のみで概ね60%程度であったが、本研究では個人性と変異性を持ちながら、かつ拡張性まで実現し、アルゴリズムの開発し、以前の研究を超える結果を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度は、手書き文字生成の拡張性の実現を目標に研究を遂行した。 本研究チームは変異性をもちかつ個人的な筆記体モデルの実現に成功した。しかし、人が書いた文字と異なる文字種を生成することはできていない。これを克服し、文字生成の拡張性を実現することを初年度の目標とした。 日本のJIS第一水準の漢字2,965個の文字は32,398画(ストローク)で構成される。文字認識の場合、認識率の低下なしで、32,398ストロークを類似のパターン同士クラスタリングすることで455個のストローク(これを圧縮ストロークと呼ぶ)まで圧縮可能である。言い換えれば455個のストロークさえあればJIS第一水準の漢字全てを作ることができる。圧縮ストロークを土台に文字を合成する際には、文字のストロークモデル(Stroke Model, SMと呼ぶ)と画間相互モデル(Inter-stroke Model, IMと呼ぶ)を用いて文字を生成する。 サンプルのない文字を生成することは難問であるが、まずSMでは書いた入力文字のストロークを標準文字の対応するクラスタの圧縮ストロークと入れ替える。出来た圧縮ストロークを再び組み合わせて文字を作る。位置と大きさの調整は後で行う。ブロックの種類と分類に関しては多くの計算量が必要であるため、事前にすべてのブロック単位を調査し、それらの相違度を計算し、ツリー状のデンドログラムを構成する。パラメータの調節により相違度の関係による探索を可能にし、合成に使うブロックを決める。SMとIMにより、人が多くの文字を書けば書くほど個人性を強く持つ文字が生成されるようになる。またSMとIMにおいて相違度を無視した場合には、すべての文字が生成されるようになる。
|
Strategy for Future Research Activity |
次年度に実施する筆者識別と毛筆文字の合成は、拡張性の精度によって大きく影響されるため、精度確保を確実に行う。現在まで筆者識別は主にOff-lineの研究が多く、100名の対象で認識率は概ね90%程度である。On-lineの場合、95%(エラー率5%)の実績もあるが、条件として数単語から1つのパラグラフ(100単語)程度の多くのデータが必要である。本研究の目標として、5文字種の5回の手書きを訓練パターンとして使用した時、エラー率を3%水準に下げる。サンプルがある合成文字とサンプルがない合成文字を使って実験を遂行して結果を分析する。 まず、合成された文字を使って筆者識別実験を実施して結果を分析する。合成された文字は実際の訓練文字の代用として直ちに使うこともできるが、筆者識別の性能が予想した通りに向上しない可能性があることから、次年度以後、これに対する研究が必要である。実際、既存の訓練パターンだけを使った時に比べて、合成された文字を併用した場合の筆者識別の正確さの向上度合いが予想(3%)より低い場合には、これはまず合成文字が既存の訓練パターンに比べて多様性が低いためであると考えられる。またどこまで未知の文字種の合成文字を使うべきかを検証するため次の3種類の手法を考案した。 (1)既知の合成された文字の多様性を増加させる。 (2)未知の合成文字を増やし、拡張性を増加させる。多様性と拡張性のどちらがどれほど効果があるのかを調べる。 (3)筆者識別システムで訓練パターンを使う方式を改善する。合成文字と原本文字を別途管理し、両方の使い方について検討し、多様性と拡張性の最適化を行う。
|
Causes of Carryover |
アルゴリズムの開発・実装、データの作成のための研究の打ち合わせが次年度になり、その分の当該助成金が生じ、次年度に使用する予定です。
|
Expenditure Plan for Carryover Budget |
次年度に筆者識別のデータの作成、筆者識別のアルゴリズムの開発・実装、筆者識別システムの開発に関する研究の打ち合わせの出張のために使用する予定です。
|
Research Products
(13 results)