研究概要 |
領域に依存しない,大容量のテキストに対して適用可能な,頑健な自動要約技術が求められている現状を踏まえ,本研究では,テキスト検索システムとの併用も想定した,電子化辞書を用いたテキスト自動要約技術の開発を行なう.本研究では,(1)テキスト検索システムでの利用を想定して,検索クエリに対応して要約を動的に生成できる自動要約技術,(2)単純にテキスト中の重要文を連結するだけでは失われがちである,要約文間の首尾一貫性を考慮した自動要約技術,(3)単なる重要文の抽出(extract)ではなく,それらの重要な内容を言い換えたりすることで短く表現し直したabstract(=(真の意味での)要約)を生成する技術の3点での開発を行なう. 10年度ではまず,「語彙的結束性を用いた要約技術」,「言い換えに基づく要約技術」という,本研究の2つの要素技術のうち「語彙的結束性を用いた要約」を計算機上に実現し,実際のテキストを用いて評価した.「語彙的結束性を用いた要約」ではまず,テキスト中の単語間の意味的なつながりを辞書を用いて検出する(この処理を「語彙的連鎖生成」と呼ぶ)必要がある.そのため,どういった単語間に意味的なつながりがあるとするかという,意味的なつながりの定義を再検討するとともに,これまでのアルゴリズムを基に,効率的に語彙的連鎖生成を行なえるアルゴリズム開発を行なった.また,得られた語彙的連鎖の情報から,テキスト中の重要な断片を抽出し要約文を作成するアルゴリズムを開発した.
|