2004 Fiscal Year Annual Research Report
最新言語処理技術を活用したスラッシュリーディング用教材生成システムの開発
Project/Area Number |
16720132
|
Research Institution | Kyushu University |
Principal Investigator |
田中 省作 九州大学, 情報基盤センター, 助手 (00325549)
|
Keywords | スラッシュリーディング / 速読学習 / 言語教育 / 自然言語処理 / 母語話者性 |
Research Abstract |
本年度の研究実施計画,1.スラッシュ付き英語テクストデータの作成,2.スラッシュ付き英語テクストデータの分析とスラッシュ挿入に強く関連する要因の洗い出し,3.スラッシュ挿入アルゴリズムの開発と実装という3点に軸を置き研究を遂行し,主に次のような成果,実績を上げた. 1.スラッシュ付き英語テクストデータの作成 少量ではあるが一貫性のあるスラッシュ付き英語データを,謝金を当て電子化し,今後の実験等の研究推進のための基盤を整えた. 2.スラッシュ付き英語テクストデータの分析とスラッシュ挿入に強く関連する要因の洗い出し 1.で作成したデータを深く観察し,スラッシュ付けの大きな要因としては,語境界の部分的統語構造(句構造文法を考えた場合,i番目の語とi+1番目の語の非終端記号からルートに辿った際,最初に交差する節に対応する生成規制)が重要な役割を果たしていることを発見した.この成果は次の3.のスラッシュ挿入アルゴリズムの開発に直接的に活かされた. 3.アルゴリズムの開発と実装 2.の成果より,部分的統語構造とスラッシュの前後の位置を考慮した確率モデルを構築し,スラッシュ挿入アルゴリズムを開発した.このアルゴリズムをPC上に実装し,1.で作成したデータを用いた評価実験を行い,従来手法よりも高い精度が得られることを確認した.この成果は,PACLIC18における併設ワークショップ,言語処理学会年次大会で発表し,英語教育担当者を中心に高い評価を得ている. 本研究が構築,公開を予定している実用的なスラッシュリーディング学習システムでは,学習者自身がWeb等から読みたい興味ある文書を選定し,教材とすることができる.そこで,事前に教材の元となる英語文書の良さを知ることは効率的学習上重要であり,本研究から派生して任意の英語文書に対して母語話者性(母語話者が書いたような質の良い文書)を統計的手法によって計量する研究を行い,英語コーパス学会等で発表し一定の成果を挙げている.この研究の成果を本研究課題に加えることで,当初計画よりさらに優れたシステムの構築が期待できる.
|