研究課題/領域番号 |
24652122
|
研究機関 | 九州大学 |
研究代表者 |
冨浦 洋一 九州大学, システム情報科学研究科(研究院, 教授 (10217523)
|
研究分担者 |
田中 省作 立命館大学, 文学部, 教授 (00325549)
安東 奈穂子 九州大学, 法学(政治学)研究科(研究院), 研究員 (50380655)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | Computer Aided Learning / 重要文 / パラフレーズ / 問題生成 / 多読 |
研究実績の概要 |
学習者が選んだ任意の英文書に対して,その内容に関する問題と解答を自動生成する手法を開発し,これを基に,内容を理解・整理しながら読むという実践的な能力を養成する多読支援システムの開発を目指す.昨年度までの研究では,複数の文の中から文書の内容に合う文1つを選択させる方式の問題が適切かつ実現可能であると判断し,そのための基本となる技術として,重要文の抽出と意味が変わらない言換え手法に関する研究を進めてきた.学習者が選んだ任意の英文書に対して問題と解答が生成できる必要があることから,現在の主流である(教師付きの)機械学習に基づく手法は適していない.また,言換えを実現するための大規模な語彙知識は公開されていない.このため,対象文書のみを用いて,著者の主張を表す重要語を抽出するための松本真宏らの手法(「語の活性度に基づくキーワード抽出法」,人工知能学会論文誌17巻4号,2002年)に基づいた重要文抽出法を開発し,小規模実験により抽出精度45%であることを確認した.また,シソーラスと検索エンジンを利用した言換え手法を開発した.言換えの対象を「他動詞+名詞」に限定し,一方の語をその同義語で置き換え,言い換え後の表現の妥当性を検索エンジンのヒット数の関数として定義した.小規模実験による評価では,coverage(何らかの言換えを出力する割合)が10%のときで精度67%であった. 現実の問題生成システムに利用するには性能が不十分であるため,平成26年度はその改善を行った.重要文抽出に関しては,松本らの手法で提案されている語の活性度と鋭活性度の両者を利用して文の重要度を定義することで,抽出精度が2%向上した.また,言換え手法に関しては,Wikipedia の記事全文から他動詞と名詞の間の結び付きの強さを推定し,これを利用した手法により,coverage10%のときで精度80%と改善した.
|