2009 Fiscal Year Annual Research Report
汎用的データベースの解析処理に基づいた英語構文指導用教材作成システムの開発
Project/Area Number |
19530773
|
Research Institution | Tohoku University |
Principal Investigator |
岡田 毅 Tohoku University, 大学院・国際文化研究科, 教授 (30185441)
|
Co-Investigator(Kenkyū-buntansha) |
坂本 泰伸 東北学院大学, 教養学部, 准教授 (60350328)
|
Keywords | コーパス / 学習支援システム / リレーショナルデータベース / 品詞標識付与 / 日本人英語学習者 / 3階層モデル |
Research Abstract |
英語非母語話者である学習者に対する学習支援システム設計の基幹部分を成すRDBMSのテーブル設計を完成させた。コーパスの文書を、文書・文・単語・という3つの階層に分類し、この階層に対してシステム利用者が解析を行うことができ、3階層の各要素それぞれには、利用者の要求に応じた修飾情報を付加することが可能となるように設計されている。この結果、支援システムでは、利用者・文書・修飾情報という3種類の情報を学習柔軟にリンクすることが可能になる。例えば、英文という要素に対して、その英文の訳の難易度という修飾情報を付加することで、学習者の習熟度に応じた翻訳練習文を提供することが可能であるし、英単語に対して、その単語が出現する教科書と学年といった修飾情報を付加することで、利用者の学習年次に応じた単語練習問題等を提供することも可能である。 このRDBMSの設計途上、前年度に開発した、プレインテキストを1行1文形式に成形するラインフォーマッタからの出力に、英単語の品詞を付与するtaggerの設計とプロトタイプ版の開発を行った。このアプリケーション開発にはJava言語を利用し、その特長の一つである強力なクラスローディングのフレームワークを利用することで、内部の処理ルーチンをフィルターと呼ばれる概念で定義し、アプリケーションの実行中にtaggerの処理アルゴリズムを、利用者の要求に応じて自由に変更することが可能となっている。 研究期間最終年度に当たり、国内の情報処理学会での発表に加え、RDBMSを中心に据えたコーパス解析システムの全容をICAME 30世界大会で、データベースのテーブル設計に関する詳細な研究成果をCorpus Linguistics 2009で、解析の結果明らかになった日本人科学者の産出する英語論文における伝達動詞の特異性についての傾向をICLCE3世界大会で、それぞれ発表した。
|