• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

高密度表現を利用したまとめ型要約に必要な言語変換技術

研究課題

研究課題/領域番号 16700134
研究機関長岡技術科学大学

研究代表者

山本 和英  長岡技術科学大学, 工学部, 講師 (40359708)

キーワードまとめ型要約 / 新幹線要約 / 換言処理 / 体言止め / 助詞止め / 高密度表現 / 自然言語処理
研究概要

原文から単語を選択して連結するだけの従来型要約手法に対して、人間の要約に近い「まとめ型要約」を目指して検討を行なった。新幹線の電光掲示板で見られるニュース記事の要約文(以下、新幹線要約)では文末表現に「【triple bond】へ」などのように原文に存在しない表現が出現するなど、要約文として顕著な特徴が見られる。そこで、新幹線要約文を対象にして、収集した約2万記事、約4万文に対して要約事例の分析を行なった。このうち、16年度は文末表現に着目して以下の研究を行なった。
(1)要約事例の分析
新幹線要約は新聞よりも約2倍文末での名詞の使用頻度が高いことが分かった。特に、サ変名詞は出現比率が約8倍であること分かり、顕著に多い。一方、助詞の比率に着目すると新幹線要約は文末での使用頻度が約6倍高い。中でも格助詞が約20倍であった。これは格助詞で文を終えることで後続する表現が省略されていることを明確にし、さらにそれらの省略表現を格助詞の使用で補うことが可能である場合にこのような表現になっていると考える。
(2)プロトタイプの実装と予備的評価
前項の分析結果を用いて、以下の10項目の要約手法を提案し、また実装した。
(a)断定表現及び敬語表現の削除(b)「示す」の削除(c)サ変動詞の換言(d)「なる」の削除(e)「明らかに」の後の削除(f)和語の換言(g)「しまう」の削除(h)「立つ」の削除(i)未来の行動を示唆する表現の対処(j)文末の複合名詞への換言
この手法に対して評価を行なった結果、提案手法全体で要約率94%、すなわち文字単位で比較した場合に原文に対して6%の文字列削減を実現した。また、(i)未来を示唆する表現の削除が多く削除されている。これは他の手法に比べて削除される部分の判定の条件が緩くなっているためと考えられる。

  • 研究成果

    (3件)

すべて 2005 2004

すべて 雑誌論文 (3件)

  • [雑誌論文] 国会会議録を対象とする話し言葉要約2005

    • 著者名/発表者名
      山本 和英, 安達 康昭
    • 雑誌名

      自然言語処理(言語処理学会誌) Vol.12,No.1

      ページ: 51-78

  • [雑誌論文] 時制と態を考慮したサ変名詞の動詞化2005

    • 著者名/発表者名
      土田雅之, 大橋一輝, 山本和英
    • 雑誌名

      言語処理学会第11回年次大会発表論文集

      ページ: 209-212

  • [雑誌論文] 「新幹線要約」のための文末の整形2004

    • 著者名/発表者名
      池田諭史, 大橋一輝, 山本和英
    • 雑誌名

      情報処理学会 研究報告 NL163-22

      ページ: 161-168

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi