研究課題/領域番号 |
20K12098
|
研究機関 | 金城大学 |
研究代表者 |
川邊 弘之 金城大学, 社会福祉学部, 教授 (60249167)
|
研究分担者 |
下村 有子 金沢大学, 設計製造技術研究所, 研究協力員 (70171006)
瀬戸 就一 金城大学短期大学部, ビジネス実務学科, 教授 (90196973)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 点字翻訳 / 深層学習 / 全盲学生 / 学生支援 |
研究実績の概要 |
日本語から点字への翻訳を深層学習、特に教師あり学習で行うためには、日本語文と点字文との対訳が必要である。点字図書館に協力を仰ぎ、点字図書の点字編集ソフトウェアの保存データを借用した。保存データから印刷時の書式データを削除して、点字データとした。一方、点字図書館から借りた点字でータのオリジナル書籍をスキャナで読み込み、OCR ソフトウェアでテキストデータ化した。誤認識があったので修正した。上記で得られた「日本語文、分かち書きカナ」対、または、「日本語文、点字文」対の対訳を用意し、ニューラル機械翻訳の深層学習で翻訳機を作成した。ネットワークモデルとして、自然言語処理で多くの成果をもたらしているtransformerを採用した。その翻訳機を用いて、日本語から点字への翻訳を行った。そして、 [1]日本語文から点字文法のカナ文字への変換、[2]カナ文字から点字文法の分かち書きカナへの変換、[3]分かち書きカナから点字への変換、[4]日本語文から点字への変換、をそれぞれ実行して、翻訳結果を評価し、良好な結果を得た。 また、字句解析と構文解析で利用するつもりであったlex(flex)と yacc(bison)が8bitコードだけを解し、日本語の多バイトコードを受け付けない仕様であることがわかったが、この仕様の制限を回避する方策(日本語1文字の 多バイト列を複数の8bitコードからなる文字列とみなす)を考案し、変換プログラム・逆変換プログラムを書いた。これにより、上記の翻訳結果の検証ができた。
|