• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

文字画像データベースを用いたテキスト化に依存しない汎用毛筆画像検索の研究

研究課題

研究課題/領域番号 16K12545
研究種目

挑戦的萌芽研究

配分区分基金
研究分野 図書館情報学・人文社会情報学
研究機関国文学研究資料館

研究代表者

野本 忠司  国文学研究資料館, 研究部, 准教授 (20321557)

研究分担者 相田 満  国文学研究資料館, 研究部, 准教授 (00249921)
研究協力者 寺沢 憲吾  
研究期間 (年度) 2016-04-01 – 2019-03-31
研究課題ステータス 完了 (2018年度)
配分額 *注記
3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2017年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2016年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワードくずし字 / 画像検索 / 文字画像認識 / 深層学習 / 文字認識 / 日本古典籍 / 毛筆画像解析 / 画像処理 / 人口知能 / 情報検索 / 毛筆画像
研究成果の概要

本件の目的は文字画像マッピングというアイデアを導入し,従来とは一線を画す,OCRやアノテーションを要しないテキスト入力型のくずし字画像の検索を実現することである.本件では,主として3つの手法の有効性を比較的大きなデータセットを用いて検証した.すなわち,(1)辞書マッピングによる手法(テキスト文字に対応するくずし字をクエリとして使う方法),(2)直接現代漢字で検索する手法,(3)サイクルガン(CycleGan)と呼ばれる手法で,現代漢字をくずし字に変形しクエリを作成した上で検索する方法である.実験の結果,(1)の手法が顕著に優位であることが判明し,本仮説を正当性を裏付けるものとなった.

研究成果の学術的意義や社会的意義

デジタル技術の発展に伴い国内の歴史的典籍が大量にデジタル化されアーカイブされている.それらのほとんどは画像形式で保存されているため,キーワードによる自由な検索ができず,コンテンツの再利用や知財化へ向けた取組みの大きな障壁になっている.手動あるいはOCRによる翻刻を用いた検索なども提案されているが実用の域に達していない.この点において本件は有用な貢献が期待できる.

報告書

(4件)
  • 2018 実績報告書   研究成果報告書 ( PDF )
  • 2017 実施状況報告書
  • 2016 実施状況報告書
  • 研究成果

    (6件)

すべて 2018 2017 2016

すべて 雑誌論文 (3件) (うち国際共著 1件、 査読あり 2件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 1件、 招待講演 1件)

  • [雑誌論文] Resolving Citation Links with Neural Networks2018

    • 著者名/発表者名
      Tadashi Nomoto
    • 雑誌名

      Frontiers in Research Metrics and Analysis

      巻: 0 ページ: 1-18

    • DOI

      10.3389/frma.2018.00031

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] A Neurally Enhanced Approach to Linking Citation to Reference.2016

    • 著者名/発表者名
      Tadashi Nomoto
    • 雑誌名

      Joint Conference on Digital Libraries

      巻: 1

    • 関連する報告書
      2016 実施状況報告書
    • 査読あり
  • [雑誌論文] .ニューラルネットを用いた引用リンクの解消2016

    • 著者名/発表者名
      野本忠司
    • 雑誌名

      情報処理学会 SIG-IFAT 研究報告

      巻: 1

    • 関連する報告書
      2016 実施状況報告書
  • [学会発表] 100歳を迎えたリーダビリティー研究:その誕生から最新動向まで2017

    • 著者名/発表者名
      野本忠司
    • 学会等名
      テキストマイニングシンポジウム
    • 発表場所
      ティーオージー会議室 大阪駅前第3ビル(大阪府大阪市
    • 年月日
      2017-02-09
    • 関連する報告書
      2016 実施状況報告書
    • 招待講演
  • [学会発表] A Neurally Enhanced Approach to Linking Citation to Reference.2016

    • 著者名/発表者名
      Tadashi Nomoto
    • 学会等名
      Joint Conference on Digital Libraries
    • 発表場所
      Rutgers University(アメリカ・ニュージャージー州)
    • 年月日
      2016-06-19
    • 関連する報告書
      2016 実施状況報告書
    • 国際学会
  • [学会発表] Going Amphibian: A Two-Pronged Approach to Finding What the News is About2016

    • 著者名/発表者名
      Tadashi Nomoto
    • 学会等名
      Microsoft Research - Korea/Japan Academic Day
    • 発表場所
      日本マイクロソフト本社(東京都港区)
    • 関連する報告書
      2016 実施状況報告書

URL: 

公開日: 2016-04-21   更新日: 2020-03-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi