本研究は、人が文字認識できる漢字字形の範囲を、学年別配当漢字1006字をもとに具体的な文字形で抽出し、基礎データ化することを目的とする。科研期間中には、文字認識可能範囲のモデル作成および基礎データ化の方法の定位までを目指す。平成10年度は、学年別配当漢字から字形構成要素に基づく典型字例を選択し、予備調査用サンプルを作成した上で、予備調査を重ねた。調査結果の検討を通して、次年度予定の本調査のための字形差の幅の設定および調査方法の定位までを次のような流れで行った。 1. 字形構成要素の定位と典型字例の選択 概形、一字内における字形部分の位置関係、点画相互の位置関係、一字内における部分の形状、部分内の点画の形状等を観点として、10種に分類・定位し、30の典型字例を選択した。 2. 典型字例の手書きサンプルの収集および予備調査用サンプルの作成 30の典型字例について、ランダム・サンプリングした硬筆文字を収集しコンピュータ入力した上で、その実態を加味しながら予備調査用サンプルを仮作成した。 3. 調査方法の検討および予備調査の実施 今回は、大学生と中学生を対象として複数回行った。対象年齢層の違いによる認識範囲の差が出たが、その結果をもとに、本調査のための字形差の幅の設定および調査方法の定位について目下検討中である。 なお、平成11年度は、高年齢層に対する予備調査・結果の検討を行った上で、本調査を実施し、文字認識可能範囲のモデル作成および基礎データ化の方法の定位までを行う予定である。
|