研究課題/領域番号 |
24500059
|
研究機関 | 三重大学 |
研究代表者 |
近藤 利夫 三重大学, 工学(系)研究科(研究院), 教授 (60324539)
|
研究分担者 |
大野 和彦 三重大学, 工学(系)研究科(研究院), 講師 (20303703)
佐々木 敬泰 三重大学, 工学(系)研究科(研究院), 助教 (20362361)
|
キーワード | 動き検出 / SIMD拡張命令 / 高並列データパス / キャッシュメモリ / タイルリング / ラスター走査 / 転置 |
研究概要 |
【動き検出法改良】高効率ながら既存のSIMD拡張命令による高速化が困難なH.265参照ソフトウェア搭載の動き検出法TZsearchに対し、新たなSIMD拡張命令の追加による高速化法を探った。具体的には、SIMDの高並列性を活かせるように予測による方向限定探索を導入することで疎らな探索の低減を試みた。その結果、圧縮率の低下を2%以下に抑えながら、探索密度を1.5倍以上に高められることを明らかにできた。 【タイル・ライン両アクセス対応の一次キャッシュの設計】昨年度示した基本構成にアドレス変換機構を付加することで、処理対象画像の横幅を2のべき乗サイズに収めればプロセッサ側からは従来のラスタ形式データと全く同じアドレス順でアクセス可能になることを示した。また、2ウェイ・ライトスルー構成で論理設計を行った。具体的には、VDECの0.18μm CMOSセルライブラリ使用による論理合成まで行い、性能低下要因となるアドレス割り振り切替とラスタラインアドレス生成ステージのレイテンシを1サイクル以内に抑えられることを明らかにした。 【高並列拡張命令セットの制定】最小値抽出命令に次探索のためのロード領域のシフト量設定機能を付加した上でスーパースカラも利用することにしてスクエアサーチの処理時間を評価し直した。その結果、昨年度の結果の倍の従来比3倍以上にまで高速化されることを明らかにできた。また、タイル・ライン両アクセス対応キャッシュのタイルアクセス機能を利用した転置命令を設けることで、DCTや2次元データ処理高速化に有効な転置を既存命令に比べ4倍以上高速化できることを示した。 【SIMD型高並列データパスの設計】これまでに制定した拡張命令セットに対応するデータパスの主要部分に位置付けられるキャッシュメモリインタフェースのパーミュテーションネットワーク、高並列処理の中核であるSAD演算部からなるデータパスとその制御回路の両方の論理設計を終えた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
動き検出について、追加した高並列拡張命令により高速化可能なスクエアサーチのみでH.265動き検出に対する十分な高効率探索が可能になる目途が立っていないのに加え、今年度中の試作完了を予定していたチップの論理設計が主要部分に留まり、設計・試作にかなりの遅れが生じている。しかし、タイル・ライン両アクセス対応キャッシュについて、DCTのみならず行列計算高速化の要にもなる転置処理を3倍以上高速化できる命令が実現されることを示したのに加え、ラスタ形式データとして見せることとキャッシュミスの最小限化とを両立する構成が論理設計まで進んだことは当初予定以上の成果といえる。
|
今後の研究の推進方策 |
翌年度の試作を確実な遂行するために以下の2つの方策をとる。 ①試作対象の最小限化 試作対象のデータパスを、高並列拡張命令、転置命令、ロード・ストア命令のサポートに必要になるハードウェア規模評価と各サポート命令のレイテンシ評価に必要最小限な機能・構成に絞る。 ②体制の強化 卒業・修了によって本研究に携わる学生が2名(M2)に減ってしまうのに対し、設計・試作評価専任として非常勤研究員(ポスドク)1名に入ってもらうのに加え、目途の立っていないH.265動き検出向け高並列拡張命令実現に向けて2名の卒研性を充てる。
|
次年度の研究費の使用計画 |
研究の遅れにより高並列拡張命令セットに対応するデータパスLSIの論理回路・レイアウト設計が予定通り進まず、LSIチップの試作発注を翌年度に繰り越さざるを得なくなったためである。 翌年度に研究の遅れの挽回をはかり高並列拡張命令セットに対応するデータパスの論理回路・レイアウト設計を完了させて、次年度の助成金と合わせて、今年度できなかったLSIチップの試作経費に充てる。
|