研究課題/領域番号 |
15K00242
|
研究機関 | 会津大学 |
研究代表者 |
愼 重弼 会津大学, コンピュータ理工学部, 上級准教授 (40315677)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 筆跡 / 文字生成 / 個人性 / 異変製 / 拡張性 / 筆者識別 / 毛筆文字の生成 |
研究実績の概要 |
研究目的(概要)※ 当該研究計画の目的について、簡潔にまとめて記述してください。 本研究は、個人の筆跡をモデル化した文字生成手法に関するものである。本研究チームは最近、個人ごとの特性にあたる(1)個人性と、個人の筆跡の揺らぎにあたる(2)変異性を持つ手書き文字を、人工的に生成することに成功した。これを踏まえ、本課題に関して3つの目標を設定した。第一に、より便利なシステムの実現を目指して、実際に人が書いたことがない文字もサンプルから合成できる手法((3)拡張性)を開発すること。第二に、生成された文字を活用して、オンライン筆者識別の性能を向上させること。 第三に、先に挙げた3つの性質を備えた人工的な毛筆文字を合成することである。 実施する筆者識別と毛筆文字の合成は、拡張性の精度によって大きく影響されるため、精度確保を確実に行った。 筆者識別は主にOff-lineの研究が多く、100名の対象で認識率は概ね90%程度である。On-lineの場合、95%(エラー率5%)の実績もあるが、条件として数単語から1つのパラグラフ(100単語)程度の多くのデータが必要である。本研究の目標として、5文字種の5回の手書きを訓練パターンとして使用した時、エラー率を3%水準に下げる。サンプルがある合成文字とサンプルがない合成文字を使って実験を遂行して結果を分析した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
合成された文字を使用した筆者識別の性能向上を試みた。 まず、合成された文字を使って筆者識別実験を実施して結果を分析した。合成された文字は実際の訓練文字の代用として直ちに使うこともできるが、筆者識別の性能が予想した通りに向上しない可能性があることから、これに対する研究が必要である。実際、既存の訓練パターンだけを使った時に比べて、合成された文字を併用した場合の筆者識別の正確さの向上が見られた。合成文字が既存の訓練パターンに比べて多様性が低いため、その度合いが予想より低いものであると考えられる。どこまで未知の文字種の合成文字を使うべきかを検証するため次の3種類の手法を考案した。 (1)既知の合成された文字の多様性を増加させる。 (2)未知の合成文字を増やし、拡張性を増加させる。多様性と拡張性のどちらがどれほど効果があるのかを調べる。 (3)筆者識別システムで訓練パターンを使う方式を改善する。合成文字と原本文字を別途管理し、両方の使い方について検討し、多様性と拡張性の最適化を行う。
|
今後の研究の推進方策 |
毛筆文字合成のためのモデル開発を行う。毛筆文字についても個人性および変異性に加え、拡張性を実現する。コンピュータで生成される毛筆文字はタブレット用ペンの筆圧、ならびにペンの角度によって形が調節される。具体的には次の4段階を経て研究・開発を進める予定である。 (1)漢字特有の「とめ・はね・はらい・おれ・まがり」について、既にモデル化されている形状と筆記速度情報に加えて、ストロークの幅と筆先の方向変化のモデルを開発する。 (2)1.で開発されたペン書きのモデルを統合して異なる文字種の毛筆文字合成のためのシステムを開発する。たとえば20文字種のペン書き文字から、1000文字種の毛筆文字を合成できるようにする。 (3)人の目から見て歪な文字がある場合、それを分析し、モデルの改良及び標準ストローク(または類似ストローク)との混ぜ合わせ、入れかえなどを検討する。 (4)統計的に発生する続きストロークを調べ、続きストロークを持つ行書体の毛筆文字への変更も可能にする。さらに現実的な表現にするためにかすれ・にじみを実現する。
|
次年度使用額が生じた理由 |
アルゴリズムの改善、データの作成および生成のための研究の打ち合わせが 次年度になり、その分の当該助成金が生じ、次年度に使用する予定です。
|
次年度使用額の使用計画 |
次年度に毛筆文字合成のためのアルゴリズムの開発・実装、毛筆のデータの作成、毛筆文字合成システムの開発に関する研究の打ち合わせの出張のために 使用する予定です。
|