• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

重要文抽出と文簡約を併用する圧縮度の高い新聞記事自動要約

Research Project

Project/Area Number 16500077
Research InstitutionThe University of Electro-Communications

Principal Investigator

尾関 和彦  電気通信大学, 電気通信学部, 教授 (50214135)

Co-Investigator(Kenkyū-buntansha) 高木 一幸  電気通信大学, 電気通信学部, 助手 (70272755)
Keywords文章要約 / 文簡約 / 情報保持 / 構文的自然性 / 係り受け整合度
Research Abstract

本研究課題では,文簡約,すなわち原文が持つ情報をできるだけ保持しながら,より短い文に自動書き換えを行なう処理が重要な位置を占めている.本年度は文簡約に関して次の研究を行なった.
1.文簡約においては,簡約された文における原文情報の保持と,構文的自然性が重要である.本研究では,構文的自然性を確保するために,文節間の係り受け整合度を利用している.これまでは,係り受け整合度を原文とは関係なく大規模なコーパスから統計的に推定していた.本年度は,原文とその人手による簡約文が対になったコーパスを用いて,原文の構造を考慮に入れながらこれを推定することを試みた.まず,原文を係り受け解析し,構文木を作る.そして,原文において係り受け経路を持つ文節対が,対応する簡約文において直接の係り受け関係を持って残存している割合を数え,これを基にして係り受け整合度の推定を行った.この情報を用いて実際に簡約文を生成し主観評価を行なったところ,原文情報の保持,構文的自然性,総合評価のいずれにおいても従来法より良好な結果が得られ,有効性が確認された.
2.本研究では,原文からいくつかの文節を選び出す文節抽出型の文簡約法を採用している。このような方法においては,原文で直接的な係り受け関係を持たない文節対が簡約文では係り受け関係を持つようになることもあり,そのままでは自然性を損なう原因となる場合がある.そこで,このようなことが起こったときには,係り文節の末尾を修正して読みやすさを向上させることを試みた.修正はまず人手により作成したルールを用いて行い,その結果をコーパスに照らして自然性の評価を行なう.自然性が低いと判定された場合は,統計的に作成したルールを用いてさらに修正を行なう.この方法で修正された簡約文の主観評価を行なったところ,修正前より読みやすさが向上するという結果が得られ,この方法の有効性が確認された.

  • Research Products

    (2 results)

All 2006

All Journal Article (2 results)

  • [Journal Article] 文節抽出型文簡約における読みやすさ向上のための文節末修正2006

    • Author(s)
      福冨 諭
    • Journal Title

      言語処理学会第12回年次大会発表論文集 (発表予定)

  • [Journal Article] 係り受け経路長を利用した新聞記事の自動簡約2006

    • Author(s)
      山形 究
    • Journal Title

      言語処理学会第12回年次大会発表論文集 (発表予定)

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi