研究概要 |
本年度は、本研究のベースとなったデイープラーニングによる語彙表現の学習手法に関して、具体的成果は次の3点である。 1)先行研究(Turian2010のWord Embeddings, Mikolov2011のRecursive Neural Networks, Schwenk2012のContinuous Space Language Models)の手法及び実験を再実装し、結果を確認した。違う分野で開発した様々なディープランーニングアーキテクチャについてパラメーターの調節などのノーハウを貯めた。 2)自然言語処理の中で最も未知語が多いタスクを複数用意して、予備実験を行った。ディープランーニングによる語彙表現に取り組んで、次のタースクで評価した: (a) ウェブテキストの係り受け解析、(b) 単語わかち書き解析、(c) 第二言語学習者の誤り訂正。 3)平成25年度に向けて機械翻訳の大規模なテキストデータ(ウィキペディアのクロールなど)を整備した。ベースライン翻訳システムを構築した。
|