• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

文書集合の構造化に基づく効率的な情報アクセス技術の開発

Research Project

Project/Area Number 16700151
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionHiroshima City University

Principal Investigator

難波 英嗣  広島市立大学, 情報科学部知能情報システム工学科, 講師 (50345378)

Project Period (FY) 2004 – 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥3,700,000 (Direct Cost: ¥3,700,000)
Fiscal Year 2006: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2005: ¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2004: ¥1,300,000 (Direct Cost: ¥1,300,000)
Keywords動向情報 / 可視化 / blog / 新聞記事 / 文書要約 / 文書横断文間関係理論 / 対応付け / 隠れマルコフモデル / 論文 / プレゼンテーションシート
Research Abstract

電子化された情報が膨大に存在する現在,ユーザが必要とする情報に効率的にアクセスするための技術が求められている.このような技術のひとつとして,日経平均株価等に関する複数の新聞記事から動向情報を抽出し,グラフとして提示する手法が提案されている.複数文書の内容をグラフ化するアプローチは,従来の複数文書要約のように複数文書の内容をひとつの文書としてまとめるアプローチと比べ,直感的にわかりやすいものであるが,グラフを見るだけでは,「なぜ数値が上がったり下がったりしているのか」,「数値の推移が社会にどのような影響を与えているのか」,といったことはわからない.しかし,これらの情報は,動向分析を行う上で,非常に重要な情報であると考えられる.
本研究では,新聞記事やblogから動向情報を抽出し可視化を行う.新聞記事を対象にした動向情報の抽出はMuSTワークショップですでに行われているが,本研究では新聞記事だけでなくblogにも拡張する.新聞記事中の数値清報の周囲に書かれている情報には,動向分析に有益なものが少なくない.しかし,新聞記事,特に報道記事には,客観的な事実しか書かれていない場合が多い.一方,blogには,客観的な事実だけではなく,blogの著者の意見や考えが多く含まれており,有用な情報源であると考えられるので,本研究では新聞記事だけでなくblogも対象にする.
提案手法の有効性を確認するため,新聞記事とblogから動向情報を抽出する実験を行った.新聞記事の場合,特に時間情報の抽出に関して,抽出すべき個所自体は特定できているものの,「同月」や「同年」といった補完が必要な表現が多く出現し,その補完に失敗するケースが多かった.これに対し,blogではこのような表現がほとんど出現していなかった。一方,数値情報の抽出精度に関しては,再現率は十分ではないものの,精度に関しては新聞記事で97%,blogで80%と,高い値が得られた.

Report

(3 results)
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • 2004 Annual Research Report
  • Research Products

    (6 results)

All 2007 2006 2005 2004

All Journal Article (6 results)

  • [Journal Article] Extraction and Visualization of Trend Information from Newspaper Articles and Blogs2007

    • Author(s)
      H.Nanba, N.Okuda, M.Okumura
    • Journal Title

      Proceedings of the 6^<th> NTCIR Workshop

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 新聞記事とblogからの動向情報の抽出と可視化2007

    • Author(s)
      奥田奈央, 難波英嗣, 奥村学
    • Journal Title

      言語処理学会第13回年次大会

      Pages: 1129-1132

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 情報抽出を利用した複数文書要約2006

    • Author(s)
      難波英嗣
    • Journal Title

      知能と情報(日本知能情報ファジィ学会誌) 18(5)

      Pages: 16-22

    • NAID

      110004821174

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 文書横断文間関係を考慮した動向情報の抽出と可視化2005

    • Author(s)
      難波英嗣, 国政美伸, 福島志穂, 相沢輝昭, 奥村学
    • Journal Title

      情報処理学会研究報告 自然言語処理 NL-168

      Pages: 67-74

    • NAID

      110003278933

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Alignment between a Technical Paper and Presentation Sheets Using a Hidden Markov Model2005

    • Author(s)
      Hayama, T., Nanba, H., Kunifuji, S.
    • Journal Title

      Proceedings of the 2005 International Conference on Active Media Technology

      Pages: 102-106

    • NAID

      110003278749

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 隠れマルコフモデルを用いた論文とプレゼンテーションシートの対応付け2004

    • Author(s)
      羽山徹彩, 難波英嗣, 國藤進
    • Journal Title

      情報処理学会 自然言語処理研究会 NL-164

      Pages: 7-12

    • NAID

      110003278749

    • Related Report
      2004 Annual Research Report

URL: 

Published: 2004-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi