研究概要 |
本研究では言語的な特徴や機械学習を用いて英語ニュースの話題識別とその続報記事の自動抽出を行った.具体的には代名詞の照応処理と機械学習の1手法であるSupport Vector Machinesを用いてニュース文の話題識別と続報記事の自動抽出を行った. 本研究でアピールする点,特に関連する研究との差異に注目した特長は以下の通りである. ●話題識別や続報記事の抽出にはキーワードの頻度を調べることが重要であることが知られている.しかし実際にはキーワードは2回目からは代名詞に置き換えられる場合が多い.今まで代名詞の照応処理結果を使って話題識別,続報記事の自動抽出を行った研究はあまりなかったが,本研究では代名詞処理の結果を利用した話題識別,続報記事の自動抽出手法を提案した(論文1参照). ●Support Vector Machines(SVM)は文書分類などで高精度の結果を得る事ができる手法であり,文書分類の研究で利用され始めている.本研究では続報記事の自動抽出にSVMを適用する手法を提案した(論文2参照).SVMを利用することにより続報記事の自動抽出の精度が上がることを実験により確認した.
|