• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

重要文抽出と文簡約を併用する圧縮度の高い新聞記事自動要約

研究課題

研究課題/領域番号 16500077
研究機関電気通信大学

研究代表者

尾関 和彦  電気通信大学, 電気通信学部, 教授 (50214135)

研究分担者 高木 一幸  電気通信大学, 電気通信学部, 助手 (70272755)
キーワード文章要約 / 文簡約 / 情報保持 / 構文的自然性 / 係り受け整合度
研究概要

本研究課題では,文簡約,すなわち原文が持つ情報をできるだけ保持しながら,より短い文に自動書き換えを行なう処理が重要な位置を占めている.本年度は文簡約に関して次の研究を行なった.
1.文簡約においては,簡約された文における原文情報の保持と,構文的自然性が重要である.本研究では,構文的自然性を確保するために,文節間の係り受け整合度を利用している.これまでは,係り受け整合度を原文とは関係なく大規模なコーパスから統計的に推定していた.本年度は,原文とその人手による簡約文が対になったコーパスを用いて,原文の構造を考慮に入れながらこれを推定することを試みた.まず,原文を係り受け解析し,構文木を作る.そして,原文において係り受け経路を持つ文節対が,対応する簡約文において直接の係り受け関係を持って残存している割合を数え,これを基にして係り受け整合度の推定を行った.この情報を用いて実際に簡約文を生成し主観評価を行なったところ,原文情報の保持,構文的自然性,総合評価のいずれにおいても従来法より良好な結果が得られ,有効性が確認された.
2.本研究では,原文からいくつかの文節を選び出す文節抽出型の文簡約法を採用している。このような方法においては,原文で直接的な係り受け関係を持たない文節対が簡約文では係り受け関係を持つようになることもあり,そのままでは自然性を損なう原因となる場合がある.そこで,このようなことが起こったときには,係り文節の末尾を修正して読みやすさを向上させることを試みた.修正はまず人手により作成したルールを用いて行い,その結果をコーパスに照らして自然性の評価を行なう.自然性が低いと判定された場合は,統計的に作成したルールを用いてさらに修正を行なう.この方法で修正された簡約文の主観評価を行なったところ,修正前より読みやすさが向上するという結果が得られ,この方法の有効性が確認された.

  • 研究成果

    (2件)

すべて 2006

すべて 雑誌論文 (2件)

  • [雑誌論文] 文節抽出型文簡約における読みやすさ向上のための文節末修正2006

    • 著者名/発表者名
      福冨 諭
    • 雑誌名

      言語処理学会第12回年次大会発表論文集 (発表予定)

  • [雑誌論文] 係り受け経路長を利用した新聞記事の自動簡約2006

    • 著者名/発表者名
      山形 究
    • 雑誌名

      言語処理学会第12回年次大会発表論文集 (発表予定)

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi