| 研究課題/領域番号 |
23K05294
|
| 研究種目 |
基盤研究(C)
|
| 配分区分 | 基金 |
| 応募区分 | 一般 |
| 審査区分 |
小区分39070:ランドスケープ科学関連
|
| 研究機関 | 甲南女子大学 |
研究代表者 |
松村 俊和 甲南女子大学, 人間科学部, 教授 (60589547)
|
| 研究期間 (年度) |
2023-04-01 – 2027-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2026年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2025年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
| キーワード | 物体検出 / 組成表 / 自動化 / デジタルデータ / 植生調査データ / ラベル付け / 機械学習 / 植物群集 / ディープラーニング / モデル |
| 研究開始時の研究の概要 |
本研究では,ディープラーニングの考え方をを植物群集の分析に取り入れることで,植物群集の分類の自動化および種の生態的な位置づける手法を開発することを目的としている.そのために,自然言語処理の考え方を利用するとともに,既存の植生調査資料を収集・整理(データ化)しつつ,研究を実施する.ディープラーニングのモデルではハイパーパラメータの最適化が必要であり,本研究では植物群集の特性と最適なハイパーパラメータとの関係を明らかにする.
|
| 研究実績の概要 |
2024年度は過去の植生データを広く収集することを主な目的として研究を実施した. 過去の植生の状況をしるうえで非常に重要であるが,デジタルデータにはなっていないものが多い.これらを手作業で組成表を入力するのは非常に手間のかかる作業である.また,組成表は独特の形式をしているため,単純な工学的文字認識(OCR)ではうまく認識できないことが多い.そこで本研究では,組成表を自動的にデジタルデータに変換するシステムを構築することを目的とした. 調査資料には,日本における地域の植生調査データの組成表を含む紙媒体の資料約80枚を使用した.教師データとして,1/3程度の資料について,調査地などのメタデータの部分,種名の記載部分,階層の記載部分,組成の記載部分のアノテーションを行った.教師データおよびPythonの物体検出ライブラリであるDetectron2を用いて学習を行い,モデルを作成した.GPUはNVIDIA RTX 4060 を使用した.未学習の調査資料について各部分の検出を行った.多少のズレはあるものの,推論の結果は概ね適切なものであった.これらをもとにOCRをすれば,適切な調査データを得られると考えられる. 上記のように,Detectron2を用いた手法によって組成表のデジタルデータへの自動的な変換は可能であることがわかった.ただし,Detectron2は高性能な物体検出システムではあるものの,インストール方法などが煩雑である.そのため,一般ユーザが使用するには困難がともなう.そこでウエブとしても使用可能なものにするために,StreamlitとUltralytics YOLOライブラリを用いて同様のシステムを開発しているところである.
|
| 現在までの達成度 |
現在までの達成度
3: やや遅れている
理由
当初は,PythonのライブラリのDetectron2での開発をしていたが,一般ユーザには利用困難であることが途中で判明した.一般ユーザでも利用可能なライブラリを探すとともに,コードの書き直しが必要であり,そのための期間を要した.
|
| 今後の研究の推進方策 |
自動化手法を早期に完成させることで,基礎的なデータの収集に注力する.また,収集したデータをもとにして,ディープラーニングによる植生データの分類手法の開発を進める.
|