Intel CPU及びNVIDIAのGPUの半精度、INT8などの対応状況まとめてみた。
AMDはZEN4除いて基本的にすべて非対応。
TCはTensorCore
FP16 | BFloat16 | TF32 | INT8 | FP8 | |
Kepler | ✕ | ✕ | ✕ | ✕ | ✕ |
Maxwell | ✕ | ✕ | ✕ | ✕ | ✕ |
Pascal | ◯ | ✕ | ✕ | ◯ | ✕ |
Volta | ◯ | ✕ | ✕ | ◯ | ✕ |
Volta(TC v1) | ◯ | ✕ | ✕ | ✕ | ✕ |
Turing | ◯ | ✕ | ✕ | ◯ | ✕ |
Volta(TC v2) | ◯ | ✕ | ✕ | ◯ | ✕ |
Ampare | ◯ | ◯ | ◯? | ◯ | ✕ |
Ampare(TC v3) | ◯ | ◯ | ◯? | ◯ | ✕ |
Hopper | ◯ | ◯ | ◯? | ◯ | ✕ |
Hopper(TC v4) | ◯ | ◯ | ◯? | ◯ | ◯ |
Skylake | ✕ | ✕ | ✕ | ✕ | ✕ |
IceLake | ✕ | ✕ | ✕ | ◯ | ✕ |
CascadeLake | ✕ | ✕ | ✕ | ◯ | ✕ |
CooperLake | ✕ | ◯ | ✕ | ◯ | ✕ |
TigerLake | ✕ | ✕ | ✕ | ◯ | ✕ |
RocketLake | ✕ | ✕ | ✕ | ◯ | ✕ |
Alderlake | ✕ | ✕ | ✕ | ✕ | ✕ |
Xeon Phi x100 | ✕ | ✕ | ✕ | ✕ | ✕ |
Xeon Phi x200 | ✕ | ✕ | ✕ | ✕ | ✕ |
Zen4 | ✕ | ◯ | ✕ | ◯ | ✕ |
参考にしたサイトなど
コメント