• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

テキスト間の関係を考慮した複数テキスト要約に関する研究

研究課題

研究課題/領域番号 16300041
研究機関東京工業大学

研究代表者

奥村 学  東京工業大学, 精密工学研究所, 助教授 (60214079)

研究分担者 難波 英嗣  広島市立大学, 情報科学部, 講師 (50345378)
キーワード複数テキスト要約 / ジャンル同定 / テキスト横断文間関係 / 意見文抽出 / 代表性
研究概要

本研究では,複数のジャンルのテキストで構成されるテキスト集合にも対処可能な複数テキスト要約技術の開発を行なう.一般に複数テキストを対象にした自動要約では,要約対象のテキスト集合の収集が要約の前段階として必要であり,その際,ジャンルの異なるテキストがテキスト集合中に混在する可能性がある.また,どのようなジャンルのテキスト集合を要約対象とするかで,要約の手法が異なる可能性がある.そこで本研究では,世の中に存在するテキストのジャンルとして主要と考えられるWebページ,科学論文,新聞記事の3つのジャンルを対象とし,(1)テキストのジャンルを特定する技術,(2)ジャンルごとのテキスト集合を要約する複数テキスト要約技術,(3)ジャンルごとのテキスト集合の要約をまとめ,複数のジャンルのテキスト集合から要約を作成する技術の3つに構成素を分解し,これらの開発を行ない,複数のジャンルのテキストで構成されるテキスト集合にも対処可能な複数テキスト要約技術を実現する.
文書横断文間関係タグ付コーパスを構築し,異なるテキスト中の文間関係を解析する技術,テキスト中の単語,表現が肯定的/否定的な記述をもたらすものであるかどうかを判定する技術,また,システムの出力する要約テキストを自動的に評価する技術を計算機上に実現した.そして,それらの有効性を評価した.

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi