研究課題
若手研究
多くの自然言語処理では,テキストをトークンと呼ばれる単位に分割してからシステムに入力する.どのようにテキストを分割するかによって自然言語処理の性能に差が出ることが知られており,性能向上に繋がるようなトークン分割の発見は自然言語処理全体の貢献になる.本研究では,自然言語処理の性能向上に繋がるトークン分割の方法を自動で見つける手法について開発する.さらに,トークン分割に使用できるトークンの集合(語彙)についても,性能の向上に寄与するものを自動的に選択できるような手法を開発する.