研究概要 |
オンライン手書き記号識別では、識別器を構築するのに膨大な量の学習パターンが必要になるのが一般的である。例えば、「あ」という平仮名を識別させるためには、ユーザーに、「あ」の文字を大量に書いてもらう必要がある。そこで、本研究では、同一筆記者が書いた少数の記号のみを用いて、大量に文字を筆記しなくとも、その筆記者が書いた記号を正確に認識する手法を考案した。具体的な手法は次のとおりである。 1.オンライン筆記情報から、ストローク記号(一筆で描かれた筆記軌跡)を抽出する。 2.各ストローク記号ごとにアフィン変換による幾何学的変形(回転、せん断、平行移動)を適用する。 3.変形したストローク記号を合成して1つの記号を生成する。 この手法を用いて、少数のオンライン筆記データから、多数の類似形状データを生成することができる。実際の記号識別器はサポートベクターマシンを用い、識別器への人力として、生成したデータから得られた方向性特徴量を用いている。平仮名の「あ」から「と」までの20文字を対象として、識別実験を行った。各文字1文字のみを同一筆記者に書いてもらい、それらを学習パターンとして識別器を構築した場合、同一筆記者が書いた別の2,000文字に対する識別率は89.15%であった。これに対し、本手法を用いて各文字から1,000文字を自動生成して、これを学習パターンとして識別器を構築した場合、識別率を97.20%に向上させることができた。 オンライン手書き記号の活用環境システムを構築する際、筆記文書の中から同一筆記者が書いた記号のみを抽出することが課題の一つである。今後、この研究成果を筆記記号検索の分野に適用できると考えている。
|