研究概要 |
2007年度の主な成果は次の通りである. 1. リーダビリティ推定式の数理モデルの再構築 順序尺度としての「学年」を指標とした英文書のリーダビリティ推定のために,従来の重回帰分析に代わる数理モデルとして順序ロジットモデルを導入した.数理的な健全性が保たれるほか,後述する2の成果とも合わせて,実際に日本人のための英文書のリーダビリティ推定式を試行的に構築した.また,同様に日本人向けに再構築したDale-Challのリーダビリティ推定式と精度を比較したところ,僅かではあるが提案手法の方が優れていることを確認した.なお,今回構築したリーダビリティ推定式はWeb上で利用できる形で公開しており,下記URLで誰でも自由に利用できる. http://www.cl.ritsumei.ac.jp/CALL/OLR/trial/ 2. 日本人英語学習者に対する親密語リストの作成 Daleリストに相当する日本人英語学習者のための親密語リストを,主要な中高教科書の電子化データに基づき作成した. 3. 文法項目の検出のための基礎調査 代表的なリーダビリティ推定式では文書中の文法的な情報は,リーダビリティ推定の要因には含まれていない(過去,導入を検討した試みはいくつかある).日本人の英語学習過程を勘案すると,文法情報もリーダビリティに強い影響を与えていることが予想され,本研究ではそれらも積極的に取り込むことを検討している.そこで,文書中(または文中単位)で使用されている文法項目を自動検出するための基礎的な研究として,学校文法に関する情報を付与した小規模用例集を構築し,機械学習理論を応用した文法項目の自動検出ルールの記述を試みた.
|