研究課題/領域番号 |
24652122
|
研究種目 |
挑戦的萌芽研究
|
研究機関 | 九州大学 |
研究代表者 |
冨浦 洋一 九州大学, システム情報科学研究科(研究院, 教授 (10217523)
|
研究分担者 |
田中 省作 立命館大学, 文学部, 教授 (00325549)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | CALL / 問題の自動生成 / パラフレーズ |
研究概要 |
英語学習者が,自身の興味と英語能力に応じて選んだ任意の英文書に対して,その内容に関する問題と解答を,自然言語処理技術を利用して自動生成する手法を開発し,これを基に,内容を理解・整理しながら読むという実践的な能力を養成する多読トレーニング支援システムの構築を目指す.H24年度は,自動生成する問題の形式と必要な技術について検討した. まず,文献[1]に基づいて,正解が文書中に直接あるいはパラフレーズされて明示されているような『パラフレーズ質問』が,内容に関する理解を問う問題として妥当であり,現在の自然言語処理の精度を考慮した場合に,解答を含めて自動生成可能な問題と判断した.問題は,文章の内容に合う文(1つ)と矛盾する文(複数)を生成し,その中から文章の内容に合う文を選択させる方式とする. 次に,内容を問う部分(選択肢の文を作成する部分)は,その文章の重要個所の1つであるべきであり,そのために自動要約における文の重要度推定法(重要個所の抽出法)の調査を行った.現在の自動要約の主流である機械学習に基づく手法では,学習者が任意に選ぶ文章の重要部分推定のためには,多種多様な分野の文章に対して重要部分を指定したようなトレーニングデータが必要となるため,機械学習によらない手法を用いることにした.また,単なる記憶問題とならないために,重要部分として取り出した文のパラフレーズを作成し,これを正解の選択肢とする.これに必要なパラフレーズ作成のための言語知識について調査したが,残念ながら公開されている大規模なものはなく,シソーラス(WordNet)と共起データに基づいて判断する代替案を考案した(評価には至っていない). 参考文献 [1]清水真紀: リーディングテストにおける質問タイプ, STEP BULLETIN, 17, 48-62 (2005).
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
H24年度に予定していた読んだ文章の内容の理解を問う問題として妥当で,かつ,自動生成可能である問題形式の策定とそのための調査・検討まで終了したため,概ね予定通りの進捗状況である.文のパラフレーズに利用する公開されている言語知識として大規模なものが発見できなかったのは想定外であったが,評価には至っていないものの入手可能なデータを用いた代替案を考案した.教材テキスト提示システムの実装は未着手であるが,以前の研究で作成したシステムを部分修正する予定であるため,大きな遅れとはならない.
|
今後の研究の推進方策 |
H24年度に考案した入手可能なデータで文のパラフレーズを作成する手法の評価をするとともに,引き続きパラフレーズ作成に利用できる公開されている言語資源の調査を行う.
|
次年度の研究費の使用計画 |
自動要約等の最新の研究動向および問題の自動生成に利用する公開されている大規模な言語資源の調査のために,計算言語学に関する国際会議である Coling(開催地インド,2012年12月)に参加する予定であったが,スケジュールの調整ができず,参加しなかったため,海外旅費として計上していた予算が未使用となった. 引き続きパラフレーズ作成に利用できる公開されている言語資源の調査を行うが,そのような言語資源がない場合を想定し,現段階で入手可能なデータ(言語資源)を利用したパラフレーズ作成法を考案している.パラフレーズとして妥当か否かの評価を英語を母語とする学生あるいは,英文校正の専門家に依頼する予定である.H24年度未使用の予算をこの謝金等に充てる.
|