研究課題/領域番号 |
16K16117
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 首都大学東京 |
研究代表者 |
小町 守 首都大学東京, システムデザイン研究科, 准教授 (60581329)
|
研究協力者 |
金子 正弘
张 ⻰图
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2018年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2017年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2016年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 深層学習 / 単語分散表現 / 文法誤り訂正 / 深層言語表現 / 文法誤り検出 / 機械翻訳 / 誤り訂正 / 誤り検出 / 表現学習 / 分散表現 / LSTM / 第二言語習得 / マルチタスク学習 / 自然言語処理 / 機械学習 / ニューラネルットワーク |
研究成果の概要 |
本研究は、文法誤り検出・訂正に深層学習を適用するアプローチを提案しました。言語学習者の書いた文章はネイティブが書いた文章と異なり、単語自体を間違えたり文脈を間違えたりしますが、これらの文脈の違いを考慮して単語を数理的にモデル化し、深層学習を用いて文法誤り検出・訂正を行いました。 また、ネイティブの書いた大規模なテキストデータから学習した文脈つきの言語表現モデルで誤り検出をする手法も提案し、英語文法誤り検出で世界最高精度を達成しました。一方、日本語や中国語については漢字を部首に分解して単語を再構成するモデルを提案し、日中のニューラル機械翻訳で有効性を示しました。
|
研究成果の学術的意義や社会的意義 |
本研究では英語学習者の文法誤り検出について、学習者の文章の誤り方を考慮して単語をモデル化することと、ネイティブが書いた大規模な文章データから獲得した文脈つきの言語表現モデルを用いることが、それぞれ有効であることを世界で初めて示し、いずれの研究においても当時の世界最高精度の精度を達成することができました。本研究は世界を代表する英語学習者の文法誤り検出の研究の一つです。
|