Research Abstract |
本年度は,主としてテキスト自動要約における重要な要素技術のひとつである,文中において削除可能な部分を認定する手法を重点的に研究した.具体的には,それに関して以下の3つの成果を得た. 1.文内要約の一要素技術として,連用修飾表現の省略可能性に関する知識を獲得する手法を提案した.具体的には,省略できる可能性のある連用修飾表現を含む節に対して,同一の動詞を持ち,かつ,格助詞出現の差異が認められる節をコーパスから検索し,検索された節対から省略可能な連用修飾表現を認定する.また,連用修飾表現の内容,及び,前後の文脈を考慮して,重要な情報が多く含まれている連用修飾表現に対しては省略可能と認定できる可能性を低く,逆に,認定対象としている連用修飾表現にそれ以前の情報が文に存在する情報が含まれている場合には省略可能と認定できる可能性が高くなるような工夫を施した.計算実験の結果,良好な結果を得た. 2.動詞を含む連体修飾節の省略可能性を修飾多様性,修飾されやすさ,修飾動詞自身の重要度等をコーパスを用いて推定する手法を考案し,その有効性を計算機実験で検証した. 3.音声要約において,ピッチ,ポーズ等,韻律的特徴のみを用いて文中の削除可能な部分を認定する手法を提案した.それを実現するため,削除の単位となる部分の境界を,やはり,ピッチ,ポーズ等,韻律的特徴のみを用いて認定する手法も考案した. 更に,テキスト自動要約における文短縮のための重要な技術である換言において,名詞とそれに対応した同一の意味を持つ略語をコーパスから自動的に獲得する手法を提案した.本手法は,名詞の表層的な情報と名詞の共起情報を用いて略語を認定する.
|