Samsungから低遅延SLC NAND SSDが登場
東芝がOptane対抗として低遅延SLC NANDの高速ストレージを出すという話が以前からあったが、意外にもSamsungが先に出してきた。
Samsung 983 ZET
- I/O性能はOptaneには及ばないが従来のSSDよりランダムI/Oがはるかに高速
- 500GBで約1000ドル
- 書き換え可能回数は約15000回(一般的なTLC NANDの20倍以上)
ダイサイズが22cmx22cm!?の巨大チップ
従来大型のGPUでもダイサイズが900㎟に収まるものである。しかしダイサイズが46,255㎟という規格外のディープラーニング用処理チップCerebrasが開発された。
ざっとスペックをTesla V100と比較すると
Cerebras | Tesla V100(V100sも同様?) | |
コア数 | 400,000 | 5,120 |
メモリ | 18GB(オンチップ) | 32GB(最大、非オンチップ) |
ダイサイズ | 46,255㎟ | 810㎟ |
消費電力 | 15,000W | 250W |
メモリが少なく感じるが、18GBはチップ上に実装されたものであり、さらに外部メモリを使用できる可能性がある。
このようなダイサイズのチップをどうやって作るのかと思うだろうが、なんとウエハー1枚を丸々使用しているとのこと。また各コアはそれほど大きくないため、製造時の不良部分については不良コアを無効化することで対応しているようだ。
演算性能は残念ながら不明。システム全体としては消費電力20,000Wの15Uシステムとして提供されるようだ。
TensorflowやPyTorchなど一般向けライブラリでCerebrasが使用可能とのことである。ただし専用コンパイラが必要なようだ。
Prefferd NetworksがMN-Coreを発表
こちらもディープラーニング向け演算チップとなる。消費電力500Wで最大演算性能は0.5PFLOPS(半精度)になるとのこと。
また、MN-Coreを使用して2EFLOPSのスーパーコンピューターを計画中のようだ。
ハイエンドチップ性能比較
半精度(TFLOPS) | 単精度(〃) | 倍精度(〃) | 消費電力 | |
Tesla V100s | 130 | 16 | 8 | 250W |
MN-Core | 500 | 131 | 33 | 500W |
GeForce RTX2080 ti | 113 | 13 | 0.4 | 250W |
Google Cloud TPU2 | 180 | ? | ? | 250W |
〃3 | 420 | ? | ? | 200W |
Xeon Platinum 8180M | <6.8 | 4.12 | 2.06 | 205W |
Xeon Platinum 9282 | <13.6 | 9.32? | 4.66? | 400W |
Ryzen TR 3990X | 18.4 | 9.2 | 4.6 | 280W |
Xeon Platinum 8180Mについては、倍精度の数字はリンク先に掲載のもの。AVX512では単精度少数は倍精度の2倍処理できるとして計算した。半精度少数はAVX512命令では扱えず、AVX2命令で(扱えるかは不明なものの)扱えるとして、単精度の2倍の速度、ターボブースト最大のクロックで扱えるものとして計算している。
Xeon Platinum 9282についてはAVX512使用時のクロックが不明であるため、ベースクロックでAVX512命令を使用できるとして倍精度、単精度性能を計算している。半精度少数の計算方法は上に同じ。
VIAがハイエンドサーバー市場に参入!?
VIA Technologiesが久々に新しいエンタープライズ向けx86プロセッサを投入すると発表。
- 8コア
- 2.5Ghz
- PCIe Gen.3 44レーン
- AI処理用アクセラレータ付き?
- AVX512対応
という従来CPU性能的にはIntelの足下にも及ばなかったVIAが悪いものを食べたんじゃないかと心配になるスペックである。
余談ではあるが、現在x86 CPUを作っているメーカーは
- Intel
- AMD
- VIA
- Elbrus
- 兆芯(VIAのアーキテクチャをベースにライセンス生産)
SPARC系CPUを作っているメーカーは
- 富士通
- cobham
がある。ARM系はライセンス先は把握できてない。IA-64は滅びた。
最近のグッと来たサーバー
最近編集部員が見つけた逸般の誤家庭垂涎の高性能サーバーを紹介したい。
GST1200-NV4
1UにTesla V100x4, Xeon Plainum x2を詰め込める狂気のハイエンドサーバー。その分ストレージ数が犠牲となっているようだ(画像を見る限り2.5インチベイx2?)。
しかし、フルサイズとハーフの拡張スロットが2つずつ空いているのが見えるため、さらにGPUなどを詰め込むことも可能のようだ。
GST4200-20
前代未聞のGPUを20機搭載できるサーバー。
しかしTesla T4は性能的にはV100に劣るので、DGX2や下のサーバーより性能は劣ると思われる。
GST10200-16
NVIDIA DGX2とほぼ同等性能の4Uサーバー。今更驚くほどのスペックではないが一応取り上げる。NIC数はDGX2よりこちらのほうが10GBASE-Tポートが一つ多い。
コメント