研究課題/領域番号 |
23K05294
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分39070:ランドスケープ科学関連
|
研究機関 | 甲南女子大学 |
研究代表者 |
松村 俊和 甲南女子大学, 人間科学部, 教授 (60589547)
|
研究期間 (年度) |
2023-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2026年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2025年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | 物体検出 / 植生調査データ / ラベル付け / 機械学習 / 植物群集 / ディープラーニング / モデル |
研究開始時の研究の概要 |
本研究では,ディープラーニングの考え方をを植物群集の分析に取り入れることで,植物群集の分類の自動化および種の生態的な位置づける手法を開発することを目的としている.そのために,自然言語処理の考え方を利用するとともに,既存の植生調査資料を収集・整理(データ化)しつつ,研究を実施する.ディープラーニングのモデルではハイパーパラメータの最適化が必要であり,本研究では植物群集の特性と最適なハイパーパラメータとの関係を明らかにする.
|
研究実績の概要 |
2023年度は研究の初年度であり,植生調査データの収集・整理および植生分類の自動化手法の構築を目的として研究を実施した.特に,植生調査データの収集・整理に力を入れて取り組んだ.植生調査データを収集・整理するにあたり,手入力では労力の限界と多大な費用が必要であると考えたことから,これらを機械学習の物体検出の手法を活用することで実施できないかと考えた. 具体的には,Detectron2を用いて,書籍や報告書に記載されている組成表を自動的に検出するとともに,各部分を自動的に認識し,部分ごとに記載されている画像を工学的文字認識することで,自動的に植生調査データを入力する方法である.日本植生誌の本文に記載されている組成表全体および各部分にラベル付を実施した.これを教師データとして,GoogleColabでGPUを用いてモデルを作成し,組成表の部分の検出および,各部分の推定を実施した.その結果,かなりの精度で表全体および表の各部分を認識できることが分かった. また,機械学習用ではないがGPUを所蔵していたことから,そのGPUをを利用して同様のことを実施した.その結果,学習時間が長くかかるだけでなく,学習精度が悪いため,検出精度が低いことが明らかになった. GoogleColabではコード実行時にエラーが表示されることが多いため,高性能のGPUをローカル環境に導入して同様のことを実施することを検討中である. 植生分類の自動化手法の構築については,多くの書籍および文献を参考にして使用するべき手法の検討は実施したが,Word2Vec,ElMo,fasttext,BERT,ALBERT,RoBERTa,Transformerなど多くの手法があり,どの手法が望ましいか検討の途中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
学内業務および調査データ収集を自動化するための手法の検討および実施に時間が取られたため.
|
今後の研究の推進方策 |
2024年度は,植生調査データを自動的に入力する手法を早いうちに確立させることで,機械学習のための調査データを大量に入手することを優先したい.また,植生調査データの自動入力は,機械学習のためだけではなく,他の研究者・自然環境の調査を実施している実務者にとっても有用な手法であると考えられる.そのため,他の研究者や実務者でも利用できる形にして,公表したい. 調査データが集まれば,植生分類の自動化手法の構築および種の分散表現モデルの構築に取りかかる.
|