研究概要 |
本研究の目的は,TVニュースから関連する通信社や新聞の記事の抽出,通信社や新聞の記事から関連するTVニュースの抽出するシステムを作成することである. 本研究でアピールする点,特に関連する研究との差異に注目した特徴は以下の通りである. ・今までの研究ではセグメンテーション処理のための窓は矩形窓を使っていたが,本研究では記事間のセグメンテーションを行なうために,窓関数を用い,セグメンテーション精度を上げている.(論文1参照) ・高精度の単語頻度を基にした語の重み付けを行なうため,代名詞と名詞の対応づけを自動で行なっている(論文2参照).特にTVニュースではキーワードが2回目からは代名詞に置き換わることが多いが,今までの研究では代名詞と名詞の対応付けを利用していなかったために,語の重み付けの精度が上げられなかった.本研究では代名詞と名詞の対応付けを利用し,語の重み付けの精度を上げることに成功した. ・通信社の速報などの短い記事から特徴を抽出し,関連するTVニュースを抽出するために,まず速報同士で類似している記事を抽出し,その抽出した記事を利用して関連するTVニュースを抽出している(論文3参照).
|