• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

文書画像アーカイブに対するテキスト情報に依存しない内容解析

研究課題

研究課題/領域番号 17K00241
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 知覚情報処理
研究機関公立はこだて未来大学

研究代表者

寺沢 憲吾  公立はこだて未来大学, システム情報科学部, 准教授 (10435985)

研究期間 (年度) 2017-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2019年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2017年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
キーワード画像、文章、音声等認識 / パターン認識 / データベース / デジタルアーカイブ
研究成果の概要

本研究では、画像特徴に基づいて特定の文字列の出現頻度や出現パターンを解析することで、機械判読が困難である文書画像に対しても、頻出語の抽出や、抽出された頻出語の重要度の評価を可能にし、さらにはこれを用いて各文書の内容を要約したり、特定のトピックと関連の高い箇所を抽出したりすることで、文書画像デジタルアーカイブの有効活用を促進する手法を開発した。また、明治期の未翻刻の新聞画像を対象に実証実験を行い、開発した手法の性能と有効性を確認した。

研究成果の学術的意義や社会的意義

本研究の成果により、手書きであったり経年劣化を経ているなどの理由で機械判読が困難である文書画像に対しても、その内容の要約や、特定のトピックと関連の高い箇所を閲覧者に提示することが可能となる。これにより、各地で整備が進み蓄積されている文書画像デジタルアーカイブが、専門研究者のみならず、一般市民や地域史に興味を持つ人々などにとっても、使いやすく便利な文献資料として、その価値を高めていくことが期待される。

報告書

(4件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実施状況報告書
  • 2017 実施状況報告書
  • 研究成果

    (3件)

すべて 2020 2018

すべて 学会発表 (3件) (うち国際学会 1件、 招待講演 1件)

  • [学会発表] Extraction of Distinctive Keywords and Articles from Untranscribed Historical Newspaper Images2020

    • 著者名/発表者名
      Sora Ito and Kengo Terasawa
    • 学会等名
      International Workshop on Advanced Image Technology, IWAIT2020
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] 文字認識が困難な文献史料画像の解析のための文字画像クラスタリング手法2018

    • 著者名/発表者名
      伊藤空,寺沢憲吾
    • 学会等名
      電子情報通信学会技術研究報告PRMU
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 歴史的文書画像に対する内容解析への取り組み2018

    • 著者名/発表者名
      寺沢憲吾
    • 学会等名
      情報処理学会第116回人文科学とコンピュータ研究会発表会
    • 関連する報告書
      2017 実施状況報告書
    • 招待講演

URL: 

公開日: 2017-04-28   更新日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi