研究概要 |
近年電子化されたテキズトが大量に世の中に満ち溢れ,情報洪水という言葉がしばしば使われる.このため,読み手が読むテキストの量を制御できるように,自動要約術による支援が求められている.このように,領域に依存しない,大容量のテキストに対して適用可能な,頑健な自動要約技術が求められている現状を踏まえ,本研究では,頑健な自然言語処理技術を統合して用いることで,高品質な要約を自動的に作成する技術の開発を行なう. 本研究では,これまでの,領域に依存しない頑健な自動要約技術の問題点を鑑み,(1)単純にテキスト中の重要文を連結するだけでは失われがちである,要約文間の首尾一貫性を考慮した自動要約技術,(2)重要文の単なる抽出だけではなく,抽出した重要文中から重要個所をさらに抽出することで,より簡潔な要約を自動的に作成する術,(3)(1),(2)の技術を統合することで,テキスト中の重要個所を抽出し,それらを適切に組み合わせることで,読み易い要約を自動的に作成する技術の3点での開発を行なう. 3年間の研究期間により,テキスト中の文間の関係を解析することで,テキストの構造を得る技術(頑健なテキスト構造解析技術),テキスト中の照応,省略を処理することで,テキスト中の話題の推移を解析する技術(頑健な照応,省略解析技術)およびそれらを用いた要約技術を計算機上に実現した.そして,それらの有効性を評価した.
|