2011 Fiscal Year Annual Research Report
日本語学習者誤用コーパスを利用した作文システムの開発
Project/Area Number |
22652048
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
仁科 喜久子 東京工業大学, 留学生センター, 教授 (40198479)
|
Co-Investigator(Kenkyū-buntansha) |
山元 啓史 東京工業大学, 留学生センター, 准教授 (30241756)
|
Keywords | 作文支援 / 共起表現 / 作文支援 / 学習者コーパス / 学習者 / 誤用 / 誤用検索ツール / 汎用アノテーション |
Research Abstract |
研究の目的、実施計画 研究の最終目的は、外国人留学生が日本の大学で論文など作成するに当たりWeb上で利用できる文書作成支援システム「なつめ」(http://wombat.ryu,titech.ac.jp/cgi-bin/goyou/goyou.cgi)構築の完成をすることである。本システムは、大規模コーパスによる大量の正用例については統計的な手法で閲覧可能にしており、これに加えて学習者が間違えやすい用例提示をすることで、さらに強力な支援が可能になることが予想される。本年度は大量の学習者作文データを機械学習させることで誤用タグ自動生成による大量のデータを利用し、統計的手法で学習者誤りとその原因を発見できるツールを開発の基礎的な研究をそれぞれのグループで以下のように行なった。 1)学習者作文誤用分析グループ:教師用誤用検索ツールフィードバックの分析をもとに、誤用分類を再検討した。特に語の意味、語と語の共起、モダリティ表現、ディスコース全体から見た誤用の分析を行なった。 2)システム構築:システムのスピードアップ、学習者履歴に見られる問題の解決を進めた。昨年度後半から開始した汎用アノテーションツールSLATEを誤用アノテーションツールとして利用して誤用タグを付与することで作業の効率化を図るとともに、ツールとしての改善策を検討した。今後、さらにアノテーションを加え、Web公表するために学習者コーパス「なたね」と命名した。 3)学会発表:アノテーション済の学習者ご用データと大規模正用データを用いた実験により、学習者の入力した文の誤用の可能性と示す手法を提案し、国際会議で発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の成果欄に示したように、学習者コーパスの設計、アノテーションツールの利用による効率的なアノテーション作業、学習者コーパスの分析、アノテーション、利用に関する研究論文の学会発表をするなど、研究計画を概ね遂行した。
|
Strategy for Future Research Activity |
24年度は最終年度であり、学習者コーパスを拡張し、アノテーションを増やすとともに、枠組みを再度点検する。学習者コーパス「なたね」をWeb上に公開することで、日本語教育全体の学習者コーパス誤用種別の標準化に貢献することを目指している。 また誤用データを正用コーパスと併用することで、学習者の文章入力時に誤用の可能性を警告することをシステムに搭載することも目指している。
|
Research Products
(13 results)