研究課題/領域番号 |
18K11399
|
研究機関 | 高知大学 |
研究代表者 |
高田 直樹 高知大学, 教育研究部自然科学系理工学部門, 教授 (50290713)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 3次元ディスプレイ / 計算機合成ホログラム / 電子ホログラフィ / 圧縮データ / リアルタイム再生 / マルチGPUクラスタ / GPU |
研究実績の概要 |
コンピュータで作成された計算機合成ホログラム(CGH)による電子化した三次元動画像再生技術(電子ホログラフィ)は,将来「究極の三次元テレビ」になるものと考えられている.しかし, CGHの計算量が膨大であることをはじめ様々な課題があり未だ実用化されていない.
本研究では,①安価で汎用的なシステムによる三次元動画の実時間再生,②膨大な物体点数からなる三次元物体の再生像の高精細化,③再生された三次元動画像の階調表現性の向上を目的とする.②では,膨大な物体点を分割し,分割した物体のCGHを高速に再生し,残像効果により物体点の補間された元の三次元物体を再生する.③では,再生像の明るさを調整できる重み付きバイナリCGHを複数枚用いて時分割多重表示により実時間動画再生を行なう.①③では,汎用的なネットワークを用いたマルチGPUクラスタシステムを用いる.②では,分割した物体のCGHを補助記憶装置に保存する.そのため,本来の再生速度の分割数倍の速度で再生する必要がある.CGHのデータ量が大きいため,①③ではノード間の転送時間が,そして,②では補助記憶装置からの読み出し時間がボトルネックとなる.そこで,CGHの圧縮処理と圧縮したCGHデータからのCGH画像作成処理をGPUで高速化し,ボトルネックを解消する.
令和元年度において,①では,ギガビットイーサネットと13枚のGPU(NVIDIA GeForce GTX 1080 Ti)を搭載したマルチGPUクラスタシステムを用いて20万点からなる三次元物体のリアルタイム動画再生に成功した.②では,当初,リアルタイム計算ではなく補助記憶装置からの再生を予定していた.しかし,CGHの圧縮・復元プログラムの性能が向上したため,①のシステムと時空間分割多重法とを併用することで100万点からなる三次元物体の高精細なリアルタイム動画再生を実現することができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
令和元年度では,平成30年度に構築したギガビットイーサネットによるマルチGPUクラスタシステムを用いて,三次元物体のリアルタイム動画再生を行った.構築したクラスタは13枚のGPU(NVIDIA GeForce GTX 1080 Ti)を搭載し,5台のPCからなる.そのうち,12枚のGPUを搭載した4台のPCはCGH計算を行うためのCGH計算ノードである.残りの1台は1枚のGPUを搭載したCGH表示ノードであり,CGH計算ノードで計算されたCGHを空間光変調器(SLM)に表示する.パイプラインアルゴリズムを用い,計算されたCGHは,CGH計算ノードからCGH表示ノードへ転送され,動画のフレーム順にSLMに表示される.しかし,CGHの転送時間は62.9msとなり,ボトルネックであった.そこで,CGH計算ノードでCGH計算した後にCGHデータを圧縮し,転送時間を2ms以内に抑えた.圧縮したCGHデータはCGH表示ノードで復元する.CPU(Intel Core i7 4770)で行うとCGHの圧縮および復元処理時間は,それぞれ7.22ms,6.61msであった.そこで,GPUで高速化し,それぞれ0.27ms,0.2msまで低減させた.最終的に,約20万点からなる三次元物体のリアルタイム動画再生に成功した.さらに,時空間分割多重法を適用し,120万点からなる三次元物体のリアルタイム動画再生を実現した.時空間分割多重法は,膨大な点数で構成された三次元物体の再生像を高精細化することもできる.当初は,あらかじめ計算されたCGHを用いる予定であったが,100万点からなる三次元物体の高精細なリアルタイム動画再生を実現することができた.また,構築したシステムにCGHの圧縮・復元処理を用いて13,000点からなる8階調を持つ三次元物体を60 fpsで動画再生することにも成功した.
|
今後の研究の推進方策 |
令和元年度に,平成30年度に構築したギガビットイーサネットを用いたマルチGPUクラスタに,高速なCGHデータの圧縮・復元処理を適用することで,CGH計算ノードとCGH表示ノード間の転送時間を2ms以内に抑えることができた.平成30年度に構築したクラスタでは,CGH計算ノードにおいて1台のPCに3枚のGPUを搭載していた.また,各GPUはPCI Express x16 (Gen 3)に接続していた.しかし,CGH計算ノードとCGH表示ノード間のデータ転送量は従来の1/32に低減されたことから,PCI Express x1(Gen2)でも実現可能となる.PCI Express x1の拡張スロットを6本搭載したマザーボードは多数ある.そして,3枚のGPUをPCI Express x16の拡張スロットに搭載可能なマザーボードに比べて価格も格段に安い.1枚のマザーボードにGPUを6枚搭載することが可能であれば,構築したクラスタのCGH計算ノード数を半減させることが可能となる.価格も安くなり,また,マルチGPUクラスタシステムの大きさもコンパクトになる.GPU (NVIDIA GeForce RTX 2080 Super)を6枚搭載したマルチGPU環境のPCを構築し,リアルタイム三次元動画再生について検討する.また,複数の重み付きバイナリCGHを用いて階調を持つ三次元物体のリアル動画再生を行う際,これまでは重み付きバイナリCGHを複数枚計算していた.しかし,同じCGH計算を重複して行っており計算の効率が悪かった.この問題を打開するため,令和元年度に効率の良い計算アルゴリズムを考案した.令和2年度に,このアルゴリズムをマルチGPUクラスタに実装し,階調を持つ三次元物体のリアルタイム動画再生について検討する.
|
次年度使用額が生じた理由 |
本年度に,TuringアーキテクチャのGPUを購入し,システムを増強する予定であった.しかし,平成30年度に開発したプログラムを改良したところ性能が向上し,低価格で小規模なシステムでも計算速度が低下しない可能性があることがわかった.そのため,令和元年度の購入を控え,次年度に新しいシステムを構築する費用として繰り越すこととした.
|