研究課題/領域番号 |
23K05294
|
研究機関 | 甲南女子大学 |
研究代表者 |
松村 俊和 甲南女子大学, 人間科学部, 教授 (60589547)
|
研究期間 (年度) |
2023-04-01 – 2027-03-31
|
キーワード | 物体検出 / 植生調査データ / ラベル付け / 機械学習 |
研究実績の概要 |
2023年度は研究の初年度であり,植生調査データの収集・整理および植生分類の自動化手法の構築を目的として研究を実施した.特に,植生調査データの収集・整理に力を入れて取り組んだ.植生調査データを収集・整理するにあたり,手入力では労力の限界と多大な費用が必要であると考えたことから,これらを機械学習の物体検出の手法を活用することで実施できないかと考えた. 具体的には,Detectron2を用いて,書籍や報告書に記載されている組成表を自動的に検出するとともに,各部分を自動的に認識し,部分ごとに記載されている画像を工学的文字認識することで,自動的に植生調査データを入力する方法である.日本植生誌の本文に記載されている組成表全体および各部分にラベル付を実施した.これを教師データとして,GoogleColabでGPUを用いてモデルを作成し,組成表の部分の検出および,各部分の推定を実施した.その結果,かなりの精度で表全体および表の各部分を認識できることが分かった. また,機械学習用ではないがGPUを所蔵していたことから,そのGPUをを利用して同様のことを実施した.その結果,学習時間が長くかかるだけでなく,学習精度が悪いため,検出精度が低いことが明らかになった. GoogleColabではコード実行時にエラーが表示されることが多いため,高性能のGPUをローカル環境に導入して同様のことを実施することを検討中である. 植生分類の自動化手法の構築については,多くの書籍および文献を参考にして使用するべき手法の検討は実施したが,Word2Vec,ElMo,fasttext,BERT,ALBERT,RoBERTa,Transformerなど多くの手法があり,どの手法が望ましいか検討の途中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
学内業務および調査データ収集を自動化するための手法の検討および実施に時間が取られたため.
|
今後の研究の推進方策 |
2024年度は,植生調査データを自動的に入力する手法を早いうちに確立させることで,機械学習のための調査データを大量に入手することを優先したい.また,植生調査データの自動入力は,機械学習のためだけではなく,他の研究者・自然環境の調査を実施している実務者にとっても有用な手法であると考えられる.そのため,他の研究者や実務者でも利用できる形にして,公表したい. 調査データが集まれば,植生分類の自動化手法の構築および種の分散表現モデルの構築に取りかかる.
|
次年度使用額が生じた理由 |
調査データの自動的な入力方法の構築に時間がかかり,またその構築には予定していただけの経費は必要でなかったため.2024年度以降は,機械学習のための高性能GPUの使用料あるいはGPU購入に経費,学会発表での経費が必要なため,それらの実行に経費を充てる予定である.
|