研究概要 |
今年度は昨年度につづき,少量のスラッシュ・リーディング用教材に基づき,自動的に素の英文にスラッシュを挿入する確率モデルの構築を進め,幾つかの教材で評価を行い,一定の性能を示すことを確認した.その成果は現在,関係学会論文誌へ投稿中である.今年度の成果は主に次の2点に集約される. (1)スラッシュ付き英文データの整備 昨年度に整備したデータは極めて少量であったので,さらに既存のスラッシュ・リーディング教材を代表的な教材2点を選定した上で電子化し,本研究で利用できる形に整備した.さらに,それらのデータを用いて,スラッシュを挿入する周辺情報(部分的統語構造・スラッシュ間の各種語数・切断する係り受けに関する情報など)を調査し,今後の確率モデルの改善につながる知見を得た. (2)確率モデルの構築と性能評価 当初の予定通り,ある語の直後でスラッシュが入る要因として,(i)部分的統語構造,(ii)前のスラッシュからの語数,(iii)文末尾までの語数などを勘案した確率モデルを構築した.昨年度および1で整備したデータごとに,スラッシュ挿入に関する実験を行い,8割弱の精度で正しくスラッシュが挿入されることを確認し,その有効性を確認した. 実験での性能評価の段階で,既存教材におけるスラッシュ挿入に関する非一貫性や,任意または本質的なスラッシュは何か,といった問題が明らかとなった.現在,英語教育担当者の協力の下,一貫性のある少量のスラッシュ・リーディング教材を作成し,提案している確率モデルの正確な性能評価,実際の教育現場での使用可能性について検討を行っている.
|