研究課題/領域番号 |
18K11350
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 金沢大学 |
研究代表者 |
深山 正幸 金沢大学, 電子情報通信学系, 准教授 (30324106)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2018年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | CNN / 意味分割 / フロー推定 / SLAM / FPGA |
研究成果の概要 |
画像から周囲環境を認識するために物体輪郭推定と距離(視差)推定を同時に行う畳み込みニューラルネット(CNN)を考案し、FPGA(Field Programmable Gate Array; 手元で書き換え可能な集積回路)に実装した。輪郭検出を、従来の輪郭・非輪郭の二値分類ではなく、物体境界からの距離を推定する回帰問題へ帰着させ、視差推定とのマルチタスク学習を可能とした。そして二つの推定を同時に行う全重み共有のCNNを考案した。これを3ビットまで量子化したが、精度低下は僅かであった。FPGA実装の結果、250 MHzで動作し、480×320画素の画像に対するスループットは134 fpsであった。
|
研究成果の学術的意義や社会的意義 |
ステレオ画像を用いた一般物体輪郭検出と視差推定の同時学習とマルチタスクCNNはこれまでに報告されていない。これを3ビットまで量子化したCNNの回路設計やFPGA実装も行われていない。このCNN回路は畳み込みの重みを変更すれば画像を画素単位でカテゴリ分類する意味的分割も実行できる。開発したFPGAは解像度480×320画素の画像に対してスループット134 fpsで動作し、自律ロボットのSLAM(自己位置推定と地図作成の同時実行)や周囲環境認識に応用できる。
|