クラウドソーシングを利用し、形態素解析用電子化辞書UniDicへアクセント情報の付与を行なった。作業者は不特定多数の非専門家であるため、アクセントを特定したい単語だけでなく、それに連接してアクセントを変化させないような後続語を同時に提示し、音声合成による発話の中からなじみのあるアクセントを選択するタスクを設定した。すでにアクセントが既知の単語をgoldとして使用するフィルタリングと、ベイズ推定による作業者と各設問のレベル推定を用いて、重み付き多数決によるアクセント情報付与を実施した。フィルタリングとタスクに対する作業者レベルの予測から居住地の違いに影響されない大規模なアクセント付与を実現した。
|