本研究では、自然言語処理における単語をベクトル化して表現する分野である単語分散表現の学習において、単語より小さい単位での分散表現から、より大きな単位の分散表現を計算する手法について研究を行いました。具体的には、機械翻訳を題材にして日中翻訳における単語分散表現学習における最適な入力の粒度を探究し、文法誤り訂正においても日本語・英語・ドイツ語・ロシア語など複数の言語でどのような知識が転移可能であるかを明らかにしました。また、単語分散表現の解釈についても取り組み、通時的な意味変化を捉えるための単語分散表現の学習において情報理論的な背景を持つアプローチを採用し、解釈性の高い手法を提案しました。
|