• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

高密度表現を利用したまとめ型要約に必要な言語変換技術

研究課題

研究課題/領域番号 16700134
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関長岡技術科学大学

研究代表者

山本 和英  長岡技術科学大学, 工学部, 助教授 (40359708)

研究期間 (年度) 2004 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
3,500千円 (直接経費: 3,500千円)
2005年度: 1,600千円 (直接経費: 1,600千円)
2004年度: 1,900千円 (直接経費: 1,900千円)
キーワード自然言語処理 / 自動要約 / 換言処理 / まとめ型要約 / 新幹線要約 / 体言止め / 助詞止め / 高密度表現
研究概要

新幹線車内や街頭での電光掲示板で流れるニュース記事(以下、新幹線要約と呼ぶ)は非常に高密度な言語表現であるため、これを題材にして実際に人間が作った高密度表現の観察、調査を行った。また、この際に得られた様々な知見を元に高密度表現への言語変換技術の提案、実装を行なった。特に、体言止めや助詞止めといった文末表現に着目し,一般的な新聞記事の表現をこのような高密度表現に加工する手法を提案した。
(1)まず、実際に2万記事に及ぶ新幹線要約記事の表現の特長を調査した。この結果、文末におけるサ変名詞での体言止めが一般の新聞記事の8倍,格助詞での助詞止めが一般の20倍出現することを調査によって確認し、新幹線要約記事における言語表現の特異性、高密度性を確認した。
(2)次に、このような高密度の文末表現を実現するための言語変換手法を提案した、この手法によって新聞記事を入力として要約実験を行った結果、文末表現に限定した要約率は12%であり、1文当たり平均して2.5文字削除することができた。また、この結果を人間が行なった文末整形の結果と比較したところ、要約率は人間とほぼ同様の結果が得られた。さらに、出力表現の評価を行なった結果、正解率は95%となった。
(3)以上得られた知見を換言処理に関する国際会議(International Workshop on Paraphrasing)に採録され、韓国にて学会発表を行った。また、学術雑誌(言語処理学会論文誌「自然言語処理」)に採録し、掲載された。

報告書

(2件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (9件)

すべて 2006 2005 2004

すべて 雑誌論文 (8件) 図書 (1件)

  • [雑誌論文] 文生成のための機能語の補完2006

    • 著者名/発表者名
      池田 諭史, 沢井 康孝, 山本 和英
    • 雑誌名

      言語処理学会第12回年次大会予稿集

      ページ: 208-211

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 構文情報を用いた名詞句の換言2006

    • 著者名/発表者名
      山崎 敦, 沢井 康孝, 山本 和英
    • 雑誌名

      言語処理学会第12回年次大会予稿集

      ページ: 775-778

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 「新幹線要約」のための文末の整形2005

    • 著者名/発表者名
      山本 和英, 池田 諭史, 大橋 一輝
    • 雑誌名

      自然言語処理(言語処理学会論文誌) Vol.12,No.6

      ページ: 85-112

    • NAID

      10016863672

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 「サ変動詞+名詞」の複合名詞への換言2005

    • 著者名/発表者名
      山本 和英, 大橋 一輝
    • 雑誌名

      自然言語処理(言語処理学会論文誌) Vol.12,No.3

      ページ: 19-42

    • NAID

      10016629494

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Transforming a Sentence End into News Headline Style.2005

    • 著者名/発表者名
      Satoshi Ikeda, Kazuhide Yamamoto
    • 雑誌名

      Proc. of The Third international workshop on Paraphrasing (IWP2005)

      ページ: 41-48

    • NAID

      10016863672

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 国会会議録を対象とする話し言葉要約2005

    • 著者名/発表者名
      山本 和英, 安達 康昭
    • 雑誌名

      自然言語処理(言語処理学会誌) Vol.12,No.1

      ページ: 51-78

    • NAID

      10014333191

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 時制と態を考慮したサ変名詞の動詞化2005

    • 著者名/発表者名
      土田雅之, 大橋一輝, 山本和英
    • 雑誌名

      言語処理学会第11回年次大会発表論文集

      ページ: 209-212

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 「新幹線要約」のための文末の整形2004

    • 著者名/発表者名
      池田諭史, 大橋一輝, 山本和英
    • 雑誌名

      情報処理学会 研究報告 NL163-22

      ページ: 161-168

    • NAID

      10016863672

    • 関連する報告書
      2004 実績報告書
  • [図書] 「日本語学」特集テーマ別ファイル(6)IT関連2005

    • 著者名/発表者名
      山本 和英
    • 総ページ数
      9
    • 出版者
      明治書院
    • 関連する報告書
      2005 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi