研究課題/領域番号 |
17K00456
|
研究機関 | 金城大学 |
研究代表者 |
川邊 弘之 金城大学, 社会福祉学部, 教授 (60249167)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 劣化点字 / 点字図書 / 復元システム |
研究実績の概要 |
研究目標「【1】点字の検出」はほぼ完了した。「【2】点字の識別・分類と表裏判定」では、識別・分類がほぼ完了したが、表裏判定がまだ残っている。「【3】誤り訂正」に向けた研究に着手した。 【2】点字の識別・分類と表裏判定 まず、「【1】点字の検出」で得た凸点の位置情報から、点字のマス座標を算出した。古書の汚れに起因するノイズと手作業による穴あけ点位置の揺らぎを考慮する方法を考案した。点位置の自己相関関数から、点についての尤度の高い座標と間隔を求め、凸点の格子を得た。この時、点の大きさや間隔に関するJIS規格の数値を参照した。点字凸点格子をマス格子に解釈し直し、点字のマス座標とした。次に、それぞれの点字のマスをカナに変換した。そのための簡単なプログラムを作成した。これらの手続きは片面印刷の場合での処理である。残っているのは点字が両面印刷されている場合である。その場合、表裏を含んだ点の検出、または、表裏を問わない点の検出とその後の表裏判定が必要になる。 【3】誤り訂正 点字の検出・分類・解釈において、誤りは当然ある。点字が両面印刷されている場合、点字は、表画像と裏画像の二度読み取られている。これらは同一の文章を与えるので、文章の再現に際して、表裏冗長性がある。これを誤り訂正に利用する。そのためのプログラムを書いているが、この検証は、上記、「【2】点字の識別・分類と表裏判定」が両面印刷点字に対して可能になった時点で開始することになっている。 画像識別の学習器を作るために、申請したシステム開発ソフトウェアを活用した。学習器の作成には計算時間がかかるので、申請したワークステーションを活用した。上記研究で得られた研究成果を論文誌や国外学会で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究目標「【1】点字の検出」はほぼ完了している。「【2】点字の識別・分類と表裏判定」では、識別・分類がほぼ完了したが、表裏判定がまだ残っている。「【3】誤り訂正」に向けた研究に着手した。 【2】点字の識別・分類と表裏判定 点字が片面印刷されている場合、「【1】点字の検出」で検出された画像には、古書の汚れに起因するノイズや手作業による穴あけ点位置の揺らぎがあったが、点位置の自己相関関数を利用することで、凸点格子や点字マス格子を算出できた。また、簡単なプログラムを作成し、点字マスをカナに変換できた。このように点字が片面印刷されている場合、「点字の識別・分類」は達成できた。残っているのは点字が両面印刷されている場合である。このように、研究目標「【2】点字の識別・分類と表裏判定」にも着手でき、相当程度達成できた。 【3】誤り訂正 点字の検出・分類・解釈において、誤りは当然ある。点字が両面印刷されている場合、点字は、表画像と裏画像の二度読み取られている。これらは同一の文章を与えるので、文章の再現に際して、表裏冗長性がある。これを誤り訂正に利用する。そのためのプログラムを書いているが、この検証は、上記、「【2】点字の識別・分類と表裏判定」が両面印刷点字に対して可能になった時点で開始することになっている。 このように、研究目標「【3】誤り訂正」にも着手でき、相当程度達成できた。
|
今後の研究の推進方策 |
研究目標「【2】点字の識別・分類と表裏判定」の実現に向けた研究を継続する。また、「【3】誤り訂正」の実現に向けた研究を継続する。 【2】点字の識別・分類と表裏判定 点字の表裏の認識・分類の学習器を深層学習で作成し、識別・分類を行う。分類を教師付き学習で行うための画像データは既に大量に得ている。表裏に分類ができれば、既に完成した「点字の識別・分類」の方法を踏襲すれば良い。その際、申請したワークステーションが多いに役に立つ。 【3】誤り訂正 「【2】点字の識別・分類と表裏判定」の結果を仮名文字・英数字・記号に変換することはできている。その訂正作業を行う。利用するのは、点字文法規則、日本語文法、表裏冗長性である。点字での文章には独特の文法規則がある。それから逸脱していたならば誤りなので、その箇所をマークアップする。その際、点字文法規則や点字の形を参考に、正解候補として挙げておく。点字の文章は分かち書きで表現されているので、それを日本語文として解析することは、それほど困難では無い。文意を解釈しないのであれば、日本語文法のみで誤りを指摘できる。点字図書が両面印刷されている場合、表裏2回のスキャンにより、全てのページから表点字画像と裏点字画像が得られる。これらは同一の点字列、同一の文章である。これが表裏冗長性である。この表裏2回のスキャンによる冗長性を利用すると、表裏一致しない点字は誤りになる。 なお、上記研究で得られた研究成果を論文誌や国内外の学会等で発表する。
|
次年度使用額が生じた理由 |
ワークステーションのメモリを増設予定であったが、年度後半においてワークステーションのメモリの値下がり傾向が顕著であったので、増設を次年度初頭に遅らせることとした。したがって、次年度早々に次年度繰越金を持って、ワークステーションのメモリを増設する。
|