平成31年度の計画は、(1)平成30年度に作成したそれぞれのプログラムの検証と動作実験、(2)全体システムの構築と全盲学生に評価を依頼する、である。 平成30年度の検証結果は、MeCabの形態素分割の精度が良くないと認められた。形態素解析のChasenもさらに悪い結果だったため、別の方法での検討を行った。その結果、AIのDeep Learningでの翻訳を試みた。Deep Learningの得意な分野の1つに機械翻訳がある。このシステムが近年充実し、平成31年にTransformerという精度のよい翻訳システムが発表された。そのため今回開発中のMeCab用のワークステーションのメモリを128GBに増設し、GPUを搭載し開発を行った。ソフトウエアは以下のとおりである。OS:Win10、GPU環境:cuda Ver.9.0、Tool kit:cudnn Ver.9.0 by NVIDIA、開発環境:Visual studio Community 2017、Python 3.6 by Python Software Foundation from Anaconda、Deep Learning環境設定:Tensorflow ver.1.10、翻訳ライブラリ:Tensor2Tensor library ver. 1.9 by Google Including Transformer。 このAIシステムでは、今までの形態素解析のデータを教師データとすることによって、今までの研究成果を生かすことができた。Deep Learningは全体システムの3か所で用いることとし、今回は点字データを墨字データに変換する箇所での実験を行った。その結果、99.86%の正解率であった。100%にするための改良とあと2つの変換については、今後引き続いて研究を行っていく。
|