• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

機械学習とOCRを用いた植物標本画像からのラベル情報自動取得プログラムの開発

研究課題

研究課題/領域番号 19K06832
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分45030:多様性生物学および分類学関連
研究機関兵庫県立大学 (2022)
兵庫県立人と自然の博物館 (2019-2021)

研究代表者

高野 温子  兵庫県立大学, 自然・環境科学研究所, 教授 (20344385)

研究分担者 三橋 弘宗  兵庫県立大学, 自然・環境科学研究所, 講師 (50311486)
藤本 悠  芸術文化観光専門職大学, 芸術文化・観光学部, 准教授 (50609534)
研究期間 (年度) 2019-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2019年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード標本デジタル化 / OCR / NER / 自然言語処理 / 固有表現抽出 / 光学文字認識 / 標本情報自動入力 / AI / テキスト抽出 / データベース / データベース構築 / 植物標本画像化
研究開始時の研究の概要

植物標本画像からラベル部分を認識し、OCRでテキスト抽出するプログラムと、テキストの属性を判断してDBの各項目へデータ振り分けを行うプログラムの開発を行う。それら2つのプログラムをオープンソースのデジタルアーカイブ管理システム「Survey Data Collector」へ実装する。実装が完了した段階で、植物標本の高速画像撮影法と合わせて国内各地でデジタルアーカイブシステムの使用説明会を開催し、希望する自然史系博物館には無償配布し、日本国内の植物標本デジタル化と整理の促進を目指す。

研究成果の概要

標本画像からのラベルデータ自動抽出法の開発を掲げた当初の目的通り、光学文字認識(OCR)と固有表現抽出(NER)の手法を用いて、ラベルデータをOCRでテキスト抽出し、抽出テキストを採集日や採集者、植物の学名等に分割し、CSVファイル形式で出力するシステムを開発した。また本研究に先立って開発していた標本画像の撮影装置普及にも努め、東京大学、京都大学等の日本国内の各研究機関に標本画像撮影装置が導入されて、日本国内の植物標本デジタル化作業の加速化に寄与することができた。

研究成果の学術的意義や社会的意義

世界に約30億ある自然史標本のデジタル化とウェブ公開は、標本へのアクセシビリティと流動性を高め、生物多様性保全とその研究の促進に大いに貢献する。本研究により開発されたラベルデータ自動読み取りシステムは、現状は植物標本に特化したシステムではあるが、他の標本ラベル情報自動読み取りシステムも今回と同じ方法で開発可能であり、自然史標本全般の流動性を高めることに寄与しうる。2022年に改正された博物館法により所蔵資料のデジタルアーカイブ作成と公開が博物館の努力義務となった今、低コストで実現可能な資料デジタルアーカイブ作成手法を全国の博物館が求めており、本研究はその一つの答えを提供している。

報告書

(5件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (10件)

すべて 2023 2022 2020 その他

すべて 雑誌論文 (3件) (うち国際共著 1件、 査読あり 3件、 オープンアクセス 3件) 学会発表 (2件) 備考 (5件)

  • [雑誌論文] Development of a system for the automated identification of herbarium specimens with high accuracy.2022

    • 著者名/発表者名
      Masato Shirai, Atsuko Takano, Takahide Kurosawa, Masahito Inoue, Shuichiro Tagane, Tomoya Tanimoto, Tohru Koganeyama, Hirayuki Sato, Tomohiko Terasawa, Takehito Horie, Isao Mandai, Takashi Akihiro
    • 雑誌名

      Scientific Reports

      巻: - 号: 1 ページ: 8066-8066

    • DOI

      10.1038/s41598-022-11450-y

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 植物標本デジタル画像化とOCRによるラベルデータ自動読みとり手法の開発2020

    • 著者名/発表者名
      高野 温子、堀内 保彦、青木 滉太、藤本 悠、三橋 弘宗
    • 雑誌名

      植物地理・分類研究

      巻: 68 号: 2 ページ: 103

    • DOI

      10.18942/chiribunrui.0682-05

    • NAID

      130007951894

    • ISSN
      0388-6212, 2433-0469
    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A Narrow Endemic or a Species Showing Disjunct Distribution? Studies on Meehania montis-koyae Ohwi (Lamiaceae)2020

    • 著者名/発表者名
      Takano Atsuko、Sakaguchi Shota、Li Pan、Matsuo Ayumi、Suyama Yoshihisa、Xia Guo-Hua、Liu Xi、Isagi Yuji
    • 雑誌名

      Plants

      巻: 9 号: 9 ページ: 1159-1159

    • DOI

      10.3390/plants9091159

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] 自然言語処理技術を用いた植物標本ラベルデータ自動抽出法の 開発2023

    • 著者名/発表者名
      髙野温子・小長井元
    • 学会等名
      日本植物分類学会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] AI画像認識技術を使って約2200種の植物の名前を高精度(96%)に判定するシステムの開発.2022

    • 著者名/発表者名
      秋廣高志・白井匡人・高野温子・黒沢高秀・井上雅仁・田金秀一郎・谷本朋也・小金山透・佐藤平行・寺澤知彦・堀江岳人・萬代功.
    • 学会等名
      日本植物分類学会
    • 関連する報告書
      2021 実施状況報告書
  • [備考] OCRと自然言語処理を用いた植物標本画像からのデータ抽出プログラム(デモ)

    • URL

      https://youtu.be/2jt_GMUqrWQ

    • 関連する報告書
      2022 実績報告書
  • [備考] ひとはく研究員個人業績紹介

    • URL

      https://www.hitohaku.jp/researchers/takano.html

    • 関連する報告書
      2020 実施状況報告書
  • [備考] 小・中規模植物標本庫に適用可能な、簡便・低予算で最低限の画質を担保した植物標本画像撮影方法の開発

    • URL

      https://www.hitohaku.jp/research/h-research/2019.html#2019-06-takano

    • 関連する報告書
      2020 実施状況報告書
  • [備考] ひとはく資料の管理と活用

    • URL

      https://www.hitohaku.jp/material/innovation.html

    • 関連する報告書
      2019 実施状況報告書
  • [備考] 植物標本デジタル化と植物標本画像からのラベル自動読み取りシステムの開発

    • URL

      https://www.hitohaku.jp/exhibition/planning/2-4_2020-takano.pdf

    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi