Intel CPU及びNVIDIAのGPUの半精度、INT8などの対応状況まとめてみた。
AMDはZEN4除いて基本的にすべて非対応。
TCはTensorCore
| FP16 | BFloat16 | TF32 | INT8 | FP8 | |
| Kepler | ✕ | ✕ | ✕ | ✕ | ✕ |
| Maxwell | ✕ | ✕ | ✕ | ✕ | ✕ |
| Pascal | ◯ | ✕ | ✕ | ◯ | ✕ |
| Volta | ◯ | ✕ | ✕ | ◯ | ✕ |
| Volta(TC v1) | ◯ | ✕ | ✕ | ✕ | ✕ |
| Turing | ◯ | ✕ | ✕ | ◯ | ✕ |
| Volta(TC v2) | ◯ | ✕ | ✕ | ◯ | ✕ |
| Ampare | ◯ | ◯ | ◯? | ◯ | ✕ |
| Ampare(TC v3) | ◯ | ◯ | ◯? | ◯ | ✕ |
| Hopper | ◯ | ◯ | ◯? | ◯ | ✕ |
| Hopper(TC v4) | ◯ | ◯ | ◯? | ◯ | ◯ |
| Skylake | ✕ | ✕ | ✕ | ✕ | ✕ |
| IceLake | ✕ | ✕ | ✕ | ◯ | ✕ |
| CascadeLake | ✕ | ✕ | ✕ | ◯ | ✕ |
| CooperLake | ✕ | ◯ | ✕ | ◯ | ✕ |
| TigerLake | ✕ | ✕ | ✕ | ◯ | ✕ |
| RocketLake | ✕ | ✕ | ✕ | ◯ | ✕ |
| Alderlake | ✕ | ✕ | ✕ | ✕ | ✕ |
| Xeon Phi x100 | ✕ | ✕ | ✕ | ✕ | ✕ |
| Xeon Phi x200 | ✕ | ✕ | ✕ | ✕ | ✕ |
| Zen4 | ✕ | ◯ | ✕ | ◯ | ✕ |
参考にしたサイトなど

コメント