• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

高密度表現を利用したまとめ型要約に必要な言語変換技術

研究課題

研究課題/領域番号 16700134
研究機関長岡技術科学大学

研究代表者

山本 和英  長岡技術科学大学, 工学部, 助教授 (40359708)

キーワード自然言語処理 / 自動要約 / 換言処理
研究概要

新幹線車内や街頭での電光掲示板で流れるニュース記事(以下、新幹線要約と呼ぶ)は非常に高密度な言語表現であるため、これを題材にして実際に人間が作った高密度表現の観察、調査を行った。また、この際に得られた様々な知見を元に高密度表現への言語変換技術の提案、実装を行なった。特に、体言止めや助詞止めといった文末表現に着目し,一般的な新聞記事の表現をこのような高密度表現に加工する手法を提案した。
(1)まず、実際に2万記事に及ぶ新幹線要約記事の表現の特長を調査した。この結果、文末におけるサ変名詞での体言止めが一般の新聞記事の8倍,格助詞での助詞止めが一般の20倍出現することを調査によって確認し、新幹線要約記事における言語表現の特異性、高密度性を確認した。
(2)次に、このような高密度の文末表現を実現するための言語変換手法を提案した、この手法によって新聞記事を入力として要約実験を行った結果、文末表現に限定した要約率は12%であり、1文当たり平均して2.5文字削除することができた。また、この結果を人間が行なった文末整形の結果と比較したところ、要約率は人間とほぼ同様の結果が得られた。さらに、出力表現の評価を行なった結果、正解率は95%となった。
(3)以上得られた知見を換言処理に関する国際会議(International Workshop on Paraphrasing)に採録され、韓国にて学会発表を行った。また、学術雑誌(言語処理学会論文誌「自然言語処理」)に採録し、掲載された。

  • 研究成果

    (6件)

すべて 2006 2005

すべて 雑誌論文 (5件) 図書 (1件)

  • [雑誌論文] 文生成のための機能語の補完2006

    • 著者名/発表者名
      池田 諭史, 沢井 康孝, 山本 和英
    • 雑誌名

      言語処理学会第12回年次大会予稿集

      ページ: 208-211

  • [雑誌論文] 構文情報を用いた名詞句の換言2006

    • 著者名/発表者名
      山崎 敦, 沢井 康孝, 山本 和英
    • 雑誌名

      言語処理学会第12回年次大会予稿集

      ページ: 775-778

  • [雑誌論文] 「新幹線要約」のための文末の整形2005

    • 著者名/発表者名
      山本 和英, 池田 諭史, 大橋 一輝
    • 雑誌名

      自然言語処理(言語処理学会論文誌) Vol.12,No.6

      ページ: 85-112

  • [雑誌論文] 「サ変動詞+名詞」の複合名詞への換言2005

    • 著者名/発表者名
      山本 和英, 大橋 一輝
    • 雑誌名

      自然言語処理(言語処理学会論文誌) Vol.12,No.3

      ページ: 19-42

  • [雑誌論文] Transforming a Sentence End into News Headline Style.2005

    • 著者名/発表者名
      Satoshi Ikeda, Kazuhide Yamamoto
    • 雑誌名

      Proc. of The Third international workshop on Paraphrasing (IWP2005)

      ページ: 41-48

  • [図書] 「日本語学」特集テーマ別ファイル(6)IT関連2005

    • 著者名/発表者名
      山本 和英
    • 総ページ数
      9
    • 出版者
      明治書院

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi