本課題は、イースター島で作られた記号の列が彫り込まれた木製の遺物について、デジタルデータの収集、そのようなデジタルデータ収集に必要な技術の研究、および収集したデジタルデータから言語情報を抽出することを目的としている。対象となる遺物は現在20点ほどが遺されており、中でも比較的大きなものを所有する教会に連絡をとるなど、所有者・所有機関に対して研究への協力を要請した。研究目的前段の収集に関しては、残念ながらデータを直接収集するための協力を得ることができなかった。 研究目的の後段である遺物の形状データからの言語情報抽出については、記号を形状をもとに文字に分類する問題に取り組んだ。これは既知言語に対する手書き文字認識の手法を参考に、記号形状の特徴量を得て、その特徴量の違いの大きさから、文字としての分類を見つけようとするものである。未解読文字の場合は正解が分からないため、既知言語を用いて手法の評価を行う。本課題の初年度にこの研究手法の基礎を作った。その時点では現代日本語の手書き文字を用いて評価を行った正解率は、その時点では満足のいくものではなかった。手法の評価のためには、さまざまな既知言語の文字データの収集と整備が必要となる。そこで、NIIおよび国文研が公開している日本語の江戸期の手書き文字のデータ、および解読が進んでいる考古学的文字としてエジプトの神官文字の画像データについて、画像を文字に分類する問題に合わせて整理した。 当初、形状の特徴量だけから分類することは困難と考えていたが、分類の候補についてクラス内の形状の類似を用いて選択することが有効であるという知見を得た。
|