2016 Fiscal Year Research-status Report
多読学習における「難しさ」の認識の解明:リーダーコーパスの構築・分析と実証的検証
Project/Area Number |
16K02904
|
Research Institution | Kyoto Sangyo University |
Principal Investigator |
加野 まきみ 京都産業大学, 文化学部, 准教授 (90352492)
|
Co-Investigator(Kenkyū-buntansha) |
ゴーベル ピーター 京都産業大学, 文化学部, 教授 (40329925)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | リーダーコーパス / Graded Readers / Youth Readers / 品詞タグ |
Outline of Annual Research Achievements |
今年度はデータ分析のための環境整備や資料の選定,予備調査などを行った.まず,コーパス環境の整備として,サーバーPCにはデータを蓄積し,クライアントPCやその他のコンピュータからアクセスができるように体制を整え,データ構築・分析のために各種ソフトウェアをインストールした.データの読み込み・後処理による差が検索結果に生じないよう,どのリーダーコーパスも同じ形式・文字コードで統一され,同じ変換処理が行われる必要がある.そのための一連の手順,コーパスに収録する統一データ形式を決定しデータの均一化の方法を定めた. また,既存のGRコーパスの拡張のためのデータの選定を行った.GRリーダーは既にLevel1~4の79冊の読み込みが完了しているので,コーパスに含むそれ以外のレベル(Starterレベル,レベル5以上)のリーダーを,図書館の貸し出し履歴,多読学習支援モジュールに記録された読書履歴などを基に,学生が好んで読んでいるものから選定した. 同時にYRコーパスに含むリーダーの選定を行った.GRの選定と同様,図書館の貸し出し履歴,多読学習支援モジュールに記録された既読履歴などから,学生が好んで読んでいるものから選んだが,この際,レベルの範囲,各レベルの語数など,GRリーダーコーパスとバランスが取れ,同じ規模(50万語)になるようにリーダーを選択した. これまでの研究で,文の構造の複雑さをパターン化して分析するためにはコーパスには品詞タグを付ける必要があることが分かっているので,既存のコーパスに,品詞タガーを用いて品詞ダグ付けを行った.リーダーの多くが会話文を多く含むフィクションストーリーであるため,品詞タグ付けの結果を,手作業で確認し,精度を上げる作業を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
現在リーダーのデータ化に少し遅れがある.リーダーはOCRで自動的に文字化した後,読み込み漏れや間違いがないか現物と突き合わせて確認を行う.また,リーダーの中には挿絵やレイアウトの都合で,自動的に文字化が困難なものが含まれ,手作業での入力となる部分があり時間を要している.
|
Strategy for Future Research Activity |
今後の研究の推進方策としては,以下の点を挙げる. ・リーダーのデータ化を本格化させる.入手したリーダーをスキャナで実際にスキャンし,PDF化,文字化を進める(研究代表者・アルバイト学生).後処理として,データ形式の統一,ファイルの統合,レベル別分類などを行い,タグ付けを行う. ・本格的なデータ分析を行うに当たって,AntConc, AntWordProfiler, RANGE, Microsoft Word「読みやすさの評価」などのツールや,BNC,COCA などの汎用コーパス,また BNC wordlist, The BNC/COCA word family lists, general service list, academic word list, COCA ngram list などの語彙表を使って,YR の「難しさ」の要因を明らかにするための予備調査を行う. ・検証実験の実施:上記の調査の結果,学生の「難しさ」認識に繋がった可能性があると判断された文法項目,文の構造,表現などを,意図的に操作した文章を作成する.また,その文章を読んだ被験者の理解度を測る質問の作成,事後のアンケートも作成する. 多読学習を一年間行った学生(約 200 名)を対象に,上記の理解度テストを作成する.実際にどの要素が理解を妨げているのか,統計的な分析を行う. ・その他リーダーの選定:多読学習に他に組み込む可能性のあるリーダー・シリーズを見極め,それぞれ読み込むデータを決定する.各種リーダーコーパスのそれぞれの言語的特徴を明らかにし,多読学習への有効性を判断する. 以上の結果を踏まえて,多読学習では GR に加えて,どのレベルで,どのようなリーダーがあれば,「難しさ」の克服に繋がり,さらにはネイティブスピーカー用の一般書への架け橋になるのか,提案をする.
|