研究課題/領域番号 |
26540042
|
研究機関 | 東京工業大学 |
研究代表者 |
宮崎 純 東京工業大学, 情報理工学(系)研究科, 教授 (40293394)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | ハードウェアトランザクショナルメモリ / 並行データ構造 / 排他制御 / 性能評価 |
研究実績の概要 |
メニーコアプロセッサ上の処理での大きなボトルネックの一つである共有データ構造の排他制御を、最近容易に利用可能となったハードウェアトランザクショナルメモリ(HTM)に加え、ロックフリーアルゴリズム、従来のロックの三種類の排他制御法を組合せて適材適所に使用し、排他制御のオーバヘッド問題を解決するための方法論の確立を目的とする。従来、これらの排他制御法の何れか一つのみを利用していたが、データの書込みならびに読出しの比率や、競合頻度、局所性などを考慮することで、これらを組み合わせて適切な並行データ構造を設計できることを目指す。 今年度は、IBMのPower8プロセッサを利用して、最大で96同時実行スレッド数での実験を通して、HTMと従来の排他制御法の組み合わせについて、ハッシュ表と単一方向リストを利用したLRUアルゴリズムの実装を題材に、それぞれの特性について明らかにした。 ハッシュ表ならびに単一方向リストはそれぞれ3通りの排他制御法で実装可能なため、組み合わせ総数は9通りである。さらに比較対象として、LRUのデータ構造全体をロックする粗粒度法も用意した。 実験の結果、同時実行スレッド数が少なくスレッド間で競合が多発する場合は、ハッシュ表とリストの両方をロックフリーアルゴリズムの場合が良いが、スレッド間で競合が少ない場合は、粗粒度ロックが適する結果となった。一方で、同時スレッド数が多い場合は常に全てにロックフリーアルゴリズムを適用した場合が良いが、スレッド間の競合が多い場合は、ハッシュ表にHTM、リストにロックフリーアルゴリズムを適用する場合でも良い性能を示した。まとめると、特定の箇所にread/writeの競合が発生するようなリストの場合は、キャッシュミスを引き起こしやすくHTMに向かないが、逆に、スレッド実行にウェイトを入れて競合確率を下げれば、性能が改善されることを明らかにした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は、最大96同時スレッドを処理可能なPower8プロセッサを利用することで、複数の排他制御を組み合わせた複合データ構造の動的特性について、LRUアルゴリズムを題材として網羅的に調査することができた。ロックフリーアルゴリズムは従来から指摘されているように、競合が多い場合に非常に高い性能であるが、既知の実装可能なデータ構造は限られている。このことを考えると、今年度の成果から、HTMを使用時にはバックオフのようなウェイトを入れて、恣意的にスレッド間の競合を下げることが必要であることが示された。 一方で、HTMを利用した際の動作の正しさの検証を試みており、HTMをモデル化し、SPINを利用して検証できることも判明している。しかしながら、HTMのモデル化でも複雑であったため、他の排他制御との組み合わせた場合については、さらにモデルが複雑となりうる。今後モデルの抽象化等の検討が必要である。 以上のように、これまでに得られた成果から、排他制御法の組み合わせ時の特性とその性能の問題に関する解決法の糸口が判明しており、また検証方法については困難に遭遇しているものの、全体としての達成度としてはおおよそ計画通りであると判断できる。
|
今後の研究の推進方策 |
来年度は、LRUよりもさらに複雑なARCと呼ばれるページ置換アルゴリズムについて、三種類の排他制御方法を適材適所に適用することに関して検討を行う予定である。ARCは参照頻度を管理するリストと参照時間を管理するリストの二つから構成されているため、複雑度はより高い。このようなケースにおける最適な排他制御について明らかにする。 さらに、基本データ構造でありデータベース等で高いスループットでアクセスが要求される木構造について、それぞれの排他制御法と実行効率との関係に関して同様の検証を行なう。特に近年の計算機は利用可能なメモリ容量が大きく、多数のコアによる高性能なデータ探索が重要となっている。一方で、木構造に関しては良いロックフリーアルゴリズムが知られておらず、ロックとHTMとの組み合わせで構成されることになる。これまでの知見から、HTMを使用する箇所にはバックオフの機能を持たせるか、あるいは競合が発生しにくい木の上部にHTM、下部にはロックを使用する等の検討ならびに検証が必要であると考えられる。 最終的には、近年利用可能となり並行プログラムを実装しやすいHTMを最大限に利用するためのデータ構造の設計方法や、性能を最大化するためのスレッド実行の制御について明らかにする予定である。
|
次年度使用額が生じた理由 |
当初、今年度内に国内で研究発表を行う予定で旅費を留保していたが、当該研究の発表の場として適切な学会が2016年5月に行われることが判明したため、その金額分が余剰となった。しかし、補助金を適切かつ有効に使用するという観点からすれば、この判断は妥当であると考えている。
|
次年度使用額の使用計画 |
繰り越す予算は、2016年5月の研究発表の旅費の一部として使用する。
|