3.2.1 Plus de précisions

Chacun de ces deux processeurs contient une interface qui code et décode les instructions et qui les lance. Derrière l'interface, plusieurs unités exécutent les instructions. Les calculateurs fonctionnent deux fois plus vite que l'interface !

Ces calculateurs sont 8 unités de calcul (SP) et 2 unités superfonctionnelles (SFU).

À chaque cycle, l'interface choisit un warp prêt à être exécuté.

Pour exécuter toutes les instructions des 32 threads, il faudra 4 cycles. Cependant, vu de l'interface, cela prendra 2 cycles.

Pour éviter que l'interface reste inactive pendant un cycle, l'idéal est d'alterner les types de warps : un premier pour les SP, un second pour les SFU.