平成23年度においては,申請者が以前作成した英語冠詞誤りの自動校正システムの性能向上を目的として,アルゴリズムの再設計を行った.その結果,システムの動作環境のマシンスペック向上による処理時間の短縮,および意味情報の付与による精度の改善が確認された. 平成24年度においては,主に以下の2つの成果が挙げられる.第一に,申請者は英語の動詞人称誤りおよび前置詞誤りの自動校正に関する競争型ワークショップに参加し,成果を発表した.動詞人称誤りについては,ルールベースの校正システムを作成したが,多様な構文への対応に課題が残る結果となった.前置詞誤りについては,申請者が過去に作成した手法を知見として,新たに固有表現抽出の結果を取り入れた機械学習ベースの手法を実装し,比較的高精度な結果を達成できた.第二に, 申請者は議会会議録から日本語の敬語表現をモデル化する手法について国際会議で成果報告を行った.公開されている地方議会会議録データから自動的に作成した敬語表現のモデルが有効である可能性を見出すことができた一方で,方言やオノマトペなどが自動解析によって誤った形で出力される場合が多く,正しい解析結果をどのようにして得るかが課題として残った. 当該年度においては,英語冠詞について特に固有名詞に付与される定冠詞に着目した研究成果の発表を行った.固有名詞とその周辺文脈の特徴を利用した機械学習ベースの手法を適用し,性能の向上を確認した.また,成果発表の際にはWikipediaを情報源として用いる追加実験についても述べた.追加実験の結果,Wikipediaの情報も併せて利用することで,より多くの固有名詞に対する定冠詞の有無を判別可能になった一方で,判別結果の信頼性の低下が確認された.今回の研究成果は,当初研究の目的として1番目に挙げた「個々の文法項目を対象とした高精度な誤り自動校正手法の実現」に該当する.
|