自然言語処理の各種タスクにおいて教師あり学習手法が利用されるが,多くの場合,領域適応の問題が生じてしまう.一方,機械学習の分野では共変量シフト下の学習が近年大きく進展した.共変量シフト下の学習は領域適応に対して利用可能であるが,自然言語処理の分野ではほとんど用いられておらず,その有効性が不明である.本研究では語義曖昧性解消の領域適応の問題に対して,共変量シフト下の学習を利用し,自然言語処理の領域適応に対しても共変量シフト下の学習の有効であることを示すことが目的である.共変量シフト下の学習には確率密度比の算出と重み付き学習法がをどのように行うかがポイントであるので,それらの実現法を具体的に提案する.また共変量シフト下の学習を語義曖昧性解消の領域適応の問題に適用する際に生じる問題点を指摘し,外れ値検出手法を利用した対策案も提示する.研究期間全体を通して,計画した内容はほぼ達成した.確率密度比を線形モデルによりモデル化し,真の確率密度比と線形モデルとの2 乗距離が最小になるようにパラメータを学習する拘束無し最小二乗重要度適合法を改善した手法を提案し,その有効性を確認できた.また重み付き学習に通常の最大エントロピー法ではなく SVM を利用する方法も提案した.様々な手法との比較実験から最適な手法は対象単語に依存することが明らかになった.最終年度では外れ値検出手法からの確率密度比の算出の試みも行ったが,以前提案した手法ほどの精度は得られないことが判明した.また領域適応では共変量シフト下の学習の他に素性への重み付け学習が有効でもあるので,最終年度では,主に素性への重み付け学習との比較実験を行い,手法間の長短を調査した.
|