2017 Fiscal Year Annual Research Report
Project/Area Number |
15H02680
|
Research Institution | Ritsumeikan University |
Principal Investigator |
冨山 宏之 立命館大学, 理工学部, 教授 (80362292)
|
Co-Investigator(Kenkyū-buntansha) |
谷口 一徹 大阪大学, 情報科学研究科, 准教授 (40551453)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | LSI設計技術 / 並列処理 / 設計自動化 |
Outline of Annual Research Achievements |
本研究は、OpenCL言語で書かれた並列プログラムを入力として、そのプログラムを効率的に実行するハードウェア(LSI)を自動的に合成する技術を開発することを目標としている。本研究は、【a】超多数の同種スレッドを効率的に実行するデータパス・アーキテクチャ、【b】プログラムに応じてデータパス構成を自動的に最適化する技術、【c】並列動作する異種のタスクに対してハードウェア資源を分配する技術の3つのテーマから構成されているが、研究の進展に伴い、平成28年度より、テーマ【a】とテーマ【b】は融合して進めている。 テーマ【a+b】については、平成28年度に引き続き、複数のCPUコアを階層的に接続するマルチ/メニーコア・アーキテクチャの研究と、専用データパスを自動合成する研究の2本立てで実施した。前者については、平成28年度に開発した32コア・アーキテクチャの性能評価を行った。複数のアプリケーションプログラムを用いて、起動するコア数などを変更させ、実行時間の変化を調査した。さらに、均質(ホモジニアス)なアーキテクチャだけでなく、非均質(ヘテロジニアス)なマルチコアアーキテクチャの開発も進めた。専用データパスについては、Xilinx社の動作合成ツールVivado HLSおよびSDSoCをベースとして、専用データパスを合成する事例研究を重ねた。更に、面積/性能/消費電力の効率を高めるため、近似計算(Approximate Computing)を行う乗算器の設計と評価を行った。 テーマ【c】については、平成28年度に引き続き、可変な並列度を有する並列タスクに対するスケジューリングについて、研究を発展させた。制約プログラミングを導入することにより、従来よりも短時間でスケジュールを行うことが可能となった。また、固定並列度タスクに対するスケジューリングについても、新たなアルゴリズムを開発した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
テーマ【a+b】超多数の同種スレッドを効率的に実行するデータパス・アーキテクチャおよび最適化については、おおむね順調に進展している。前述の通り、テーマ【a+b】は、マルチコア/メニーコア・アーキテクチャと専用データパス自動合成の2つのアプローチで研究を進めている。マルチコア/メニーコア・アーキテクチャに関しては、大きく進展している。32コア・アーキテクチャを設計、FPGA上に実装し、その上で実際にソフトウェアを動作させている。査読付き国際会議で2件、査読付き国内ワークショップで1件の発表を行った。国際会議で発表した2件のうち1件は、Best Paper Awardを受賞したことも特筆すべきである。専用データパス自動合成については、自動合成ツールの実装という点ではやや研究が遅れているが、近似計算回路技術について大きく進展した。英文論文誌で1編の論文を公表し、査読付き国際会議で2件、国内ワークショップで1件の発表を行った。 テーマ【c】並列動作する異種のタスクに対してハードウェア資源を分配する技術については、順調に進展している。英文論文誌で3編の論文を公表した他、査読付き国際会議で1件、査読付き国内ワークショップで1件の発表を行った。 上記の通り、【a】~【c】のテーマによって若干の差があるが、プロジェクト全体として、おおむね順調に進展している。
|
Strategy for Future Research Activity |
平成30年度は、本研究の最終年度(4年計画の4年目)となる。個々のテーマを発展させつつ、3つのテーマを連携・融合させることに重点をおく。自動合成システムとして体系化し、設計事例研究を重ね、評価を行う。 テーマ【a+b】については、平成28年度から29年度にかけて、技術的な融合を図ってきており、FPGAボードを使った実装および評価を重ねてきた。具体的には、多数の同種スレッドを、FPGA上に実装された複数のPE(Processing Element)で実行し、実行時間を測定する実験を重ねてきた。しかし、テーマ【c】については、理想的な条件下における理論研究に留まっており、パソコン上での計算による評価に留まってきた。平成30年度は、テーマ【c】のハードウェア資源分配技術により、複数の異種タスクに対してPEを割り当て、その割り当て結果に基づき、これらのタスクをFPGA上に実装された複数のPE上で並列に動作させる。テーマ【c】をテーマ【a】【b】と融合するにあたっては、まず、平成29年度までは簡単化のために考慮していなかったタスク間通信時間やリアルタイム制約などを考慮する。
|
Research Products
(13 results)