研究課題/領域番号 |
17K00456
|
研究機関 | 金城大学 |
研究代表者 |
川邊 弘之 金城大学, 社会福祉学部, 教授 (60249167)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 劣化点字 / 点字図書 / 復元システム |
研究実績の概要 |
研究目標「【1】点字の検出」に向けた研究に着手した。また、「【2】点字の識別・分類と表裏判定」に向けた研究にも着手した。 【1】点字の検出 まず、点字図書をスキャンして画像イメージとした。このとき、図書の破損を防ぐため、書籍入力用の非破壊スキャナを用いた。使い勝手とその後の解析作業の効率を検討し、以降の標準スキャナを決定した。画像検出には多くのポジティブ画像(検出させたいオブジェクトを含む画像)とネガティブ画像(検出させたいオブジェクトを含まない画像)が必要になる。我々は既に約15,000文字の点字画像(ポジティブ画像)と点字の無い部分の画像(ネガティブ画像)を持っている。さらに、多くに画像をスキャナで読み込み、点字の検出や識別・分類に利用した。点字画像の検出には、画像処理ライブラリのOpenCV を用いた。検出において「疑わしきは点字」を原則とし、検出漏れが無いように調整した。偽画像は後の「【2】点字の識別・分類と表裏判定」でネガティブ画像と判断されるからである。 画像識別の学習器を作るために、申請したシステム開発ソフトウェアを活用した。学習器の作成には計算時間がかかるので。既存のワークステーションも活用しつつ研究を行った。 【2】点字の識別・分類と表裏判定 「【1】点字の検出」で検出された画像には、ポジティブ画像に加えネガティブ画像も含まれていた。点字図書が両面印刷されている場合、スキャン画像には表点字(凸点字)と裏点字(凹点字)が混ざっている。これらを識別・分類できる学習器を作った。そして「【1】点字の検出」で検出された画像を表裏判定し、識別・分類した。処理には、機械学習の一種である深層学習を実装したDIGITS(NVIDIA)を用いた。 上記研究で得られた研究成果を論文誌や国外学会で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究目標「【1】点字の検出」に向けた研究に着手した。また、「【2】点字の識別・分類と表裏判定」に向けた研究にも着手した。 【1】点字の検出 まず、点字図書をスキャンして画像イメージとした。このとき、図書の破損を防ぐため、書籍入力用の非破壊スキャナを用いた。使い勝手とその後の解析作業の効率を検討し、以降の標準スキャナを決定した。画像検出には多くのポジティブ画像(検出させたいオブジェクトを含む画像)とネガティブ画像(検出させたいオブジェクトを含まない画像)が必要になる。我々は既に約15,000文字の点字画像(ポジティブ画像)と点字の無い部分の画像(ネガティブ画像)を持っている。さらに、多くに画像をスキャナで読み込み、点字の検出や識別・分類に利用した。点字画像の検出には、画像処理ライブラリのOpenCV を用いた。検出において「疑わしきは点字」を原則とし、検出漏れが無いように調整した。偽画像は後の「【2】点字の識別・分類と表裏判定」でネガティブ画像と判断されるからである。 このように、研究目標「【1】点字の検出」は達成できた。 【2】点字の識別・分類と表裏判定 「【1】点字の検出」で検出された画像には、ポジティブ画像に加えネガティブ画像も含まれていた。点字図書が両面印刷されている場合、スキャン画像には表点字(凸点字)と裏点字(凹点字)が混ざっている。これらを識別・分類できる学習器を作った。そして「【1】点字の検出」で検出された画像を表裏判定し、識別・分類した。処理には、機械学習の一種である深層学習を実装したDIGITS(NVIDIA)を用いた。 このように、研究目標「【2】点字の識別・分類と表裏判定」にも着手でき、相当程度達成できた。
|
今後の研究の推進方策 |
研究目標「【2】点字の識別・分類と表裏判定」の実現に向けた研究を継続する。また、「【3】誤り訂正」に向けた研究にも着手する。 【2】点字の識別・分類と表裏判定 上で述べたように、認識・分類の学習器を作成し、深層学習で点字の識別・分類を行う。深層学習には大きな演算量が必要である。少しでも効率的に学習を進めるために、機械学習用演算装置を申請した。深層学習を使うが、結果が芳しくない、計算時間がかかりすぎるなどのトラブルを招くようならば、別の処方、例えば、独自の画像処理プログラムの開発も考える。 この研究は前年からの継続なので、研究開始2年目に終わらせることに問題はない。しかし、研究が遅滞するようならば、次の「【3】誤り訂正」よりもこちらを優先する。 【3】誤り訂正 まず、「【2】点字の識別・分類と表裏判定」の結果を仮名文字・英数字・記号に変換する。そして、訂正作業を行う。利用するのは、点字文法規則、日本語文法、表裏冗長性である。点字での文章には独特の文法規則がある。それから逸脱していたならば誤りなので、その箇所をマークアップする。その際、点字文法規則や点字の形を参考に、正解候補として挙げておく。点字の文章は分かち書きで表現されているので、それを日本語文として解析することは、それほど困難では無い。文意を解釈しないのであれば、日本語文法のみで誤りを指摘できる。点字図書が両面印刷されている場合、表裏2回のスキャンにより、全てのページから表点字画像と裏点字画像が得られる。これらは同一の点字列、同一の文章である。これが表裏冗長性である。この表裏2回のスキャンによる冗長性を利用すると、表裏一致しない点字は誤りになる。 なお、上記研究で得られた研究成果を論文誌や国内外の学会等で発表する。
|
次年度使用額が生じた理由 |
(理由) 新規システム開発用ワークステーションの導入において平成29年度内での購入を控えた。これは、CPUメーカーの製品更新の発表に伴い、メーカーが出荷するワークステーションの刷新が予定されていたからである。平成29年度の研究では、既存ワークステーションを最大限活用することができたので、研究計画への影響は軽微であった。 (使用計画) 平成30年度に延期になっていたシステム開発用ワークステーションを導入する。
|