2020 Fiscal Year Research-status Report
Braille translation system supporting student volunteers
Project/Area Number |
20K12098
|
Research Institution | Kinjo University |
Principal Investigator |
川邊 弘之 金城大学, 社会福祉学部, 教授 (60249167)
|
Co-Investigator(Kenkyū-buntansha) |
下村 有子 金城大学, 社会福祉学部, 教授 (70171006)
瀬戸 就一 金城大学短期大学部, ビジネス実務学科, 教授 (90196973)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 点字翻訳 / 深層学習 / 全盲学生 / 学生支援 |
Outline of Annual Research Achievements |
日本語から点字への翻訳を深層学習、特に教師あり学習で行うためには、日本語文と点字文との対訳が必要である。まず、点字図書館に協力を仰ぎ、点字図書の点字編集ソフトウェアの保存データを借用した。保存データから印刷時の書式データを削除して、点字データとした。一方、点字図書館から借りた点字データのオリジナル書籍をスキャナで読み込み、OCR ソフトウェアでテキストデータ化した。誤認識があったので修正した。 上記で得られた「日本語文、分かち書きカナ」対、または、「日本語文、点字文」対の対訳を用意し、ニューラル機械翻訳の深層学習で翻訳機を作成した。ネットワークモデルとして、transformerを採用した。その翻訳機を用いて、日本語から点字への翻訳を行っている。そして、 [1] 日本語文から点字文法のカナ文字への変換、[2] カナ文字から点字文法の分かち書きカナへの変換、[3] 分かち書きカナから点字への変換、をそれそれ実行して、翻訳結果を評価している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初1年目は、点字から分かち書きカナへの変換プログラムを作成する予定であった。しかし、字句解析と構文解析で利用するつもりであったlex(flex)とyacc(bison)が8bitコードだけを解し、日本語の多バイトコードを受け付けないことがわかったので、この部分を後回しにし、2年目で予定していた深層学習による点字翻訳を前倒しした。 ニューラル機械翻訳のネットワークモデルとして、transformerを採用したが、十分に良好な翻訳結果を得ている。
|
Strategy for Future Research Activity |
lex(flex)とyacc(bison)の仕様から後回しにした点字→分かち書きカナ逆変換プログラムの作成に取り掛かる。この仕様の制限を回避する方策(日本語1文字の多バイト列を複数の8bitコードからなる文字列とみなす)を考案したので、逆変換プログラムを書くことができる。 ニューラル機械翻訳において、[1] 日本語文から点字文法のカナ文字への変換、[2] カナ文字から点字文法の分かち書きカナへの変換、[3] 分かち書きカナから点字への変換、をそれそれ実行し、翻訳の精度を比較する。
|
Causes of Carryover |
システム開発用タワー型ワークステーションの納品が遅れたため、内蔵記憶装置(高速大容量SSD)が未購入のままである。その購入に充てるつもりであった金額が差額になっている。翌年度、内蔵記憶装置を購入する。
|