• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

重要文抽出と文簡約を併用する圧縮度の高い新聞記事自動要約

研究課題

研究課題/領域番号 16500077
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関電気通信大学

研究代表者

尾関 和彦  電気通信大学, 電気通信学部, 教授 (50214135)

研究分担者 高木 一幸  電気通信大学, 電気通信学部, 助手 (70272755)
研究期間 (年度) 2004 – 2006
研究課題ステータス 完了 (2006年度)
配分額 *注記
3,000千円 (直接経費: 3,000千円)
2006年度: 700千円 (直接経費: 700千円)
2005年度: 700千円 (直接経費: 700千円)
2004年度: 1,600千円 (直接経費: 1,600千円)
キーワード文章要約 / 文簡約 / 文節重要度 / 係り受け整合度 / 文節対応付け / 係り受け経路長 / 情報保持 / 構文的自然性 / 係り受け / 概念距離
研究概要

1.本研究では,学習データとして原文と人手による簡約文が対になった新聞記事データベースを使用している.このデータベースを用いると,人が行なう簡約の傾向に関する情報を得ることができ,自動簡約に役立っ.このような情報抽出を有効に行なうためには,原文と簡約文の間の文節対応付けを行なう必要がある.そのため,概念距離と係り受けを利用した対応付けアルゴリズムを開発した.
2.当該研究期間以前は,原文の集合から係り受け距離の分布を求め,それに基づいて係り受け整合度を定めていた.しかし,この方法では原文とそれに対応する簡約文の関係が反映されていない。この問題を解決するため,まず,原文と簡約文の間の文節対応付けを行なった.そして,原文においてある係り受け経路長を持つ文節対が簡約文において係り受け距離1で現れる相対頻度を求め,それに基づいて係り受け整合度を定めた.これを用いて簡約文を生成し,主観評価実験を行なったところ,重要情報の保持,構文的自然性,総合評価のいずれにおいても改善が認められた.
3.本研究で採用している文節抽出型文簡約においては,原文中で係り受け関係になかった文節対が簡約文では係り受け関係を持っようになり,文の自然性が損なわれることがある.その場合でも係り文節の末尾を修正することにより,自然性を向上させることができる.ここでは,ルールベースと統計ベースの2つの方法により文節末を修正する方法を提案し,主観評価実験によりその有効性を確かめた.
4.文節重要度と係り受け整合度はヒューリスティックな方法で定めていたが,それを確率論的な枠組みで定式化し直して簡約文生成を行なった.主観評価実験の結果,この方法とヒューリスティックな方法はほぼ同等な性能を持つことが明らかになった.

報告書

(4件)
  • 2006 実績報告書   研究成果報告書概要
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (19件)

すべて 2007 2006 2005

すべて 雑誌論文 (19件)

  • [雑誌論文] 確率的な手法による日本語文簡約2007

    • 著者名/発表者名
      福冨 諭
    • 雑誌名

      言語処理学会第13回年次大会発表論文集

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Japanese sentence compression using probabilistic approach2007

    • 著者名/発表者名
      Satoshi Fukutomi, Kazuyuki Takagi, Kazuhiko Ozeki
    • 雑誌名

      Proc. of NLP200 D5-2

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 確率的な手法による日本語文簡約2007

    • 著者名/発表者名
      福冨 諭
    • 雑誌名

      言語処理学会第13回年次大会発表論文集 D5-2(印刷中)

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 文節抽出型文簡約における読みやすさ向上のための文節末修正2006

    • 著者名/発表者名
      福冨 諭
    • 雑誌名

      言語処理学会第12回年次大会発表論文集

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 係り受け経路長を利用した新聞記事の自動簡約2006

    • 著者名/発表者名
      山形 究
    • 雑誌名

      言語処理学会第12回年次大会発表論文集

      ページ: 2-11

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Sentence compression using statistical information about dependency path length2006

    • 著者名/発表者名
      Kiwamu Yamagata
    • 雑誌名

      Proceedings of TSD 2006 (Lecture Notes in Artificial Intelligence, Springer-Verlag) 4188

      ページ: 127-134

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Modification of phrase-ending for improving readability in sentence compression by phrase selection2006

    • 著者名/発表者名
      Satoshi Fukutomi, Kazuyuki Takagi, Kazuhiko Ozeki
    • 雑誌名

      Proc. of NLP2006 D5-5

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Newspaper article summarization using dependency path length2006

    • 著者名/発表者名
      Kiwamu Yamagata, Satoshi Fukutomi, Kazuyuki Takagi, Kazuhiko Ozeki
    • 雑誌名

      Proc. of NLP2006 P2-11

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Sentence compression using statistical information about dependency path length2006

    • 著者名/発表者名
      Kiwamu Yamagata, Satoshi Fukutomi, Kazuyuki Takagi, Kazuhiko Ozeki
    • 雑誌名

      Proc. of TSD 2006(LNAI 4188, Springer)

      ページ: 127-134

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Sentence compression using statistical information about dependency path length2006

    • 著者名/発表者名
      Kiwamu Yamagata
    • 雑誌名

      Proc. TSD 2006 (LNAI 4188)

      ページ: 127-134

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Sentence compression : p progress report2006

    • 著者名/発表者名
      Kazuhiko Ozeki
    • 雑誌名

      The 6th China-Japan Natural language Processing Joint Research Promotion Conference (CD作成中)

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 文節抽出型文簡約における読みやすさ向上のための文節末修正2006

    • 著者名/発表者名
      福冨 諭
    • 雑誌名

      言語処理学会第12回年次大会発表論文集 (発表予定)

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 係り受け経路長を利用した新聞記事の自動簡約2006

    • 著者名/発表者名
      山形 究
    • 雑誌名

      言語処理学会第12回年次大会発表論文集 (発表予定)

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 概念距離と係り受けを利用した要約文の文節対応付け2005

    • 著者名/発表者名
      福冨 諭
    • 雑誌名

      情報処理学会第67回全国大会講演論文集

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 概念距離と係り受けを利用した要約文の文節対応付け2005

    • 著者名/発表者名
      福冨 諭
    • 雑誌名

      言語処理学会第11回年次大会発表論文集

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Aligning phrases in original text and its summary using concept distance and inter-phrase dependency2005

    • 著者名/発表者名
      Satoshi Fukutomi, Kazuyuki Takagi, Kazuhiko Ozeki
    • 雑誌名

      Proc. of 67th Annual Meeting of IPSJ 5J-2

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Aligning phrases in original text and its summary using concept distance and inter-phrase dependency2005

    • 著者名/発表者名
      Satoshi Fukutomi, Kazuyuki Takagi, Kazuhiko Ozeki
    • 雑誌名

      Proc. of NLP2005 D3-8

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 概念距離と係り受けを利用した要約文の文節対応付け2005

    • 著者名/発表者名
      福冨 論
    • 雑誌名

      情報処理学会第67回全国大会講演論文集 第2分冊

      ページ: 119-120

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 概念距離と係り受けを利用した要約文の文節対応付け2005

    • 著者名/発表者名
      福冨 論
    • 雑誌名

      言語処理学会第11回年次大会発表論文集 (発表予定)

    • 関連する報告書
      2004 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi