研究課題/領域番号 |
19K06246
|
研究機関 | 千葉大学 |
研究代表者 |
栗原 伸一 千葉大学, 大学院園芸学研究院, 教授 (80292671)
|
研究分担者 |
加藤 顕 千葉大学, 大学院園芸学研究院, 准教授 (70543437)
丸山 敦史 千葉大学, 大学院園芸学研究院, 教授 (90292672)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 遊休農地 / 所有者意向 / 機械学習 / 農地流動化 |
研究実績の概要 |
研究3年目となる2021年度は,機械学習による遊休農地所有者意向予測の前段階として,全国農地ナビのWebサイトから抽出した農地情報と地図情報を用いて,プロビット回帰分析を実施した。なお,予測対象地としては,耕作放棄の影響が顕在化しやすい首都圏の中でも,意向が把握されている遊休農地の数が多い水戸市(茨城県)と勝浦市(千葉県)を選定した。 使用した変数は,目的変数として農地情報から所有者意向(売りたい・貸したい:1,自ら耕作したい:0)を,説明変数として同じ農地情報から所在地域(水戸市:1,勝浦市:0),面積(㎡),地目(田:1,畑:0),農振法区分(農業振興地域:1,地域外・調査中:0)を用いた。ほかにも都市計画区分や貸借権等権利設定の内容,農地中間管理権などの変数候補もあったが,欠損や偏りが大きいため採用しなかった。また地図情報からは,農地の区画整理状況(整理済:1,未整理:0),農地中心から最寄り道路までの距離(m),最寄り道路の幅員(m),道路に面しているかどうか(有道路地:1,無:0),30万㎡以内に4軒以上の住宅の有無(有:1,無:0)を手作業で読み取り,それぞれを説明変数として用いた。 279件の遊休農地のうち,無作為に抽出した学習データ195件で計測した結果,水戸市ダミーと道路までの距離,有道路地ダミーがプラス,そして区画整理ダミーがマイナスで統計的に有意な係数であった。つまり,売り貸しに出される可能性の高い遊休農地の属性として,(同じ地域ならば)区画整理がされておらず,最寄りの道路が遠くにあることなどが予想された。また,分類正解率も72%と比較的高いモデルが計測された。 だだし,検証用に残した84件のテストデータにおける本計測モデルの分類正解率はわずか24%であることから,やはり機械学習を用いた予測の必要性も再確認された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
進捗状況はやや遅れている。現在まで,従来の計量経済学的手法ではあるものの,実際に農地情報を用いた意向予測モデルを推定するなど,進捗もあった。一方で,当初は全国農地ナビからスクレイピングによって自動的に収集する予定であった予測モデルの変数において,予想よりも欠損値や偏りが多いことが判明したため,急遽,衛星画像から手作業で読み取り,新たな変数を加えることにした。そのため,当初計画よりもデータセット作成に遅れが発生してしまった。 また,結果はまだ整理していないものの,作成したデータセットを用いて,いくつかの機械学習モデルを用いて,予備的な分析を実施した。その結果,有力候補であったニューラルネットワークとランダムフォレストとデータとの相性が悪かったことも,当初計画よりもやや送れてしまった理由である。ただし,もう1つの機械学習モデルであるサポートベクターマシンとの相性は良いことが判明したため,来年度はこのサポートベクターマシンを使用して意向予測モデルを構築できそうな道筋が立った状況である。 なお,来年度のサポートベクターマシン構築に向けて,データセットに主成分分析を実施し,サポートベクトル(分類のための境界曲線)を代替予想したところ,極めて複雑な境界で意向が分類されており,本分類器を用いることの妥当性が証明された。ちなみに,第1主成分の負荷量は,田ダミーがプラス,道路距離や幅員,水戸ダミーがマイナスに大きく,第2主成分は有道路地ダミーと住宅地ダミーがプラス,道路距離がマイナスに大きくなっていることも判明した。サポートベクターマシンは,計算過程がブラックボックスとなっており,因果構造が把握できないため,こうした従来の多変量解析の結果との併合も重要であろう。
|
今後の研究の推進方策 |
本来は2021年度が最終年度であったが,既述のような理由から進捗がやや遅れてしまったため,もう1年延長することで本研究課題を完了させる。 2021年度までにデータセットは完成しており,また用いる機械学習モデルもサポートベクターマシン(SVM)を構築することに決定している。SVMは,クラス分類を目的とした教師あり機械学習アルゴリズムのなかでもデータのノイズに強く,分類性能が極めて高いことが知られており,高い予測が期待できる。また,ランダムフォレストに比べて小標本でも高い予測精度を持つ分類器を構築できるといわれていることから,本研究の目的により適している。 一方で,SVMの短所として,計算過程がブラックボックスとなるため要因を探ることが出来ないということ以外にも,ハイパーパラメータのチューニング次第で予測精度が大きく左右されるという問題がある。チューニングとは,(一般的なガウス型のradial basis functionカーネルの場合)Cとγという2つのハイパーパラメータの最適値を探すことである。それらを大きく設定すれば学習データを分類する能力は高くなるが,未知データを分類する能力の低い“過学習”となる。機械学習は未知データを高い精度で予測することが目的であることから,学習不足にならない程度に小さな値を設定することが重要である。よって,最終年度となる2022年度は,これらのハイパーパラメータのチューニングを慎重に行い,学習データだけでなく未知データにおいても高い精度で予測可能な分類器を構築する。 また,新型コロナウィルスの蔓延によって,これまで実施できなかった国内の遊休農地の現地調査や,海外研究機関との本研究課題手法に関する研究打ち合わせを再開するとともに,遊休農地に対する市民意識を調査することで,我が国の遊休農地の流動化に資する大局的な研究を完成させる。
|
次年度使用額が生じた理由 |
昨年度に引き続き新型コロナウィルスが蔓延したため,当該年度に予定していた国内の遊休農地現地調査ならびに機械学習に関する海外打ち合わせの旅費を執行できなかったのが,次年度使用額が生じた主な理由である。 翌年度は,これら国内外の調査/打ち合わせを開催するため旅費として使用する計画であるが,新型コロナウィルスが収束しない場合には,ZOOMで代替させるなどの十分な対策を講じることで研究を遅らせないようにする。 また,最終年度となる次年度度は,地域住民へ遊休農地に対する意識調査を実施することで,遊休農地の流動化が地域や地域農業へ及ぼす影響についても記述的/計量的に明らかにする。なお,この意識調査は民間調査会社のモニターを対象としたもので,単なるアンケート調査ではなく,近年,実験経済学分野で注目されているオークション実験を適用する予定である。
|