• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 研究成果報告書

機械学習とOCRを用いた植物標本画像からのラベル情報自動取得プログラムの開発

研究課題

  • PDF
研究課題/領域番号 19K06832
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分45030:多様性生物学および分類学関連
研究機関兵庫県立大学 (2022)
兵庫県立人と自然の博物館 (2019-2021)

研究代表者

高野 温子  兵庫県立大学, 自然・環境科学研究所, 教授 (20344385)

研究分担者 三橋 弘宗  兵庫県立大学, 自然・環境科学研究所, 講師 (50311486)
藤本 悠  芸術文化観光専門職大学, 芸術文化・観光学部, 准教授 (50609534)
研究期間 (年度) 2019-04-01 – 2023-03-31
キーワード標本デジタル化 / OCR / NER / 自然言語処理
研究成果の概要

標本画像からのラベルデータ自動抽出法の開発を掲げた当初の目的通り、光学文字認識(OCR)と固有表現抽出(NER)の手法を用いて、ラベルデータをOCRでテキスト抽出し、抽出テキストを採集日や採集者、植物の学名等に分割し、CSVファイル形式で出力するシステムを開発した。また本研究に先立って開発していた標本画像の撮影装置普及にも努め、東京大学、京都大学等の日本国内の各研究機関に標本画像撮影装置が導入されて、日本国内の植物標本デジタル化作業の加速化に寄与することができた。

自由記述の分野

植物分類学

研究成果の学術的意義や社会的意義

世界に約30億ある自然史標本のデジタル化とウェブ公開は、標本へのアクセシビリティと流動性を高め、生物多様性保全とその研究の促進に大いに貢献する。本研究により開発されたラベルデータ自動読み取りシステムは、現状は植物標本に特化したシステムではあるが、他の標本ラベル情報自動読み取りシステムも今回と同じ方法で開発可能であり、自然史標本全般の流動性を高めることに寄与しうる。2022年に改正された博物館法により所蔵資料のデジタルアーカイブ作成と公開が博物館の努力義務となった今、低コストで実現可能な資料デジタルアーカイブ作成手法を全国の博物館が求めており、本研究はその一つの答えを提供している。

URL: 

公開日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi