研究概要 |
近年電子化されたテキストが大量に世の中に満ち溢れ,情報洪水という言葉がしばしば使われる.このため,読み手が読むテキストの量を制御できるように,自動要約技術による支援が求められている.このように,領域に依存しない,大容量のテキストに対して適用可能な,頑健な自動要約技術が求められている現状を踏まえ,本研究では,頑健な自然言語処理技術を統合して用いることで,高品質な要約を自動的に作成する技術の開発を行なう. 本研究では,これまでの,領域に依存しない頑健な自動要約技術の問題点を鑑み,(1)単純にテキスト中の重要文を連結するだけでは失われがちである,要約文間の首尾一貫性を考慮した自動要約技術,(2)重要文の単なる抽出だけではなく,抽出した重要文中から重要個所をさらに抽出することで,より簡潔な要約を自動的に作成する技術,(3)(1),(2)の技術を統合することで,テキスト中の重要個所を抽出し,それらを適切に組み合わせることで,読み易い要約を自動的に作成する技術の3点での開発を行なう. 13年度では,テキスト中の文間の関係を解折することで,テキストの構造を得る技術(頑健なテキスト構造解析技術),テキスト中の照応、省略を処理することで,テキスト中の話題のつながりを解析する技術(頑健な照応,省略解析技術)および,それらを用いた要約技術を計算機上に実現した.
|