研究課題/領域番号 |
20K12098
|
研究機関 | 金城大学 |
研究代表者 |
川邊 弘之 金城大学, 社会福祉学部, 教授 (60249167)
|
研究分担者 |
下村 有子 金沢大学, 設計製造技術研究所, 研究協力員 (70171006)
瀬戸 就一 金城大学短期大学部, ビジネス実務学科, 教授 (90196973)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 点字翻訳 / 深層学習 / 全盲学生 / 学生支援 |
研究実績の概要 |
日本語から点字への翻訳を深層学習、特に教師あり学習で行うためには、日本語文と点字文との対訳が必要である。点字図書館に協力を仰ぎ、点字図書の点字編集ソフトウェアの保存データを借用した。保存データから印刷時の書式でータを削除して、点字データとした。一方、点字図書館から借りた点字データの オリジナル書籍をスキャナで読み込み、OCR ソフトウェアでテキストデータ化した。誤認識があったので修正した。 上記で得られた「日本語文、分かち書きカナ」対、または、「日本語文、点字文」対の対訳を用意し、ニューラル機械翻訳の深層学習で翻訳機を作成した。ネットワークモデルとして、transformerを採用した。その翻訳機を用いて、日本語から点字への翻訳を行っている。そして、 [1]日本語文から点字文法のカナ文字への変換、[2]カナ文字から点字文法の分かち書きカナへの変換、[3]分かち書きカナから点字への変換、[4]日本語文から点字への変換、をそれぞれ実行して、翻訳結果を評価している。 また、字句解析と構文解析で利用するつもりであったlex(flex)と yacc(bison)が8bitコードだけを解し、日本語の多バイトコードを受け付けない仕様であることがわかったが、この仕様の制限を回避する方策(日本語1文字の 多バイト列を複数の8bitコードからなる文字列とみなす)を考案したので、逆変換プログラムを書いている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初1年目は、点字から分かち書きカナへの変換プログラムを作成する予定であった。しかし、字句解析と構文解析で利用するつもりであったlex(flex)と yacc(bison)が8bitコードだけを解し、日本語の多バイトコードを受け付けないことがわかったので、この部分を後回しにし、2年目で予定していた深層学習による点字翻訳を前倒しした。 ニューラル機械翻訳のネットワークモでルとして、transformerを採用したが、十分に良好な翻訳結果を得ている。 2年目には、当初1年目に予定していた点字から分かち書きカナへの変換プログラムの作成に着手した。字句解析と構文解析で利用するlex(flex)と yacc(bison)が8bitコードだけを解し、日本語の多バイトコードを受け付けない仕様であったが、この仕様の制限を回避する方策(日本語1文字の多バイト列を複数の8bitコードからなる文字列とみなす)を考案できたことが突破口となった。
|
今後の研究の推進方策 |
lex(flex)とyacc(bison)の仕様から後回しにした点字→分かち書きカナ逆変換プログラムを完成させる。 ニューラル機械翻訳において、[1] 日本語文から点字文法のカナ文字への変換、[2] カナ文字から点字文法の分かち書きカナへの変換、[3] 分かち書きカナから点字への変換、[4]日本語文から点字への変換、をそれぞれ実行し、翻訳の精度を比較する。
|
次年度使用額が生じた理由 |
高速演算装置(GPU)の製造が半導体不足の影響で遅れているため、未購入である。その購入に充てるつもりであった金額が差額になっている。
|