Mas Tipos De Procesadores De AMD
3 Parte
AMD
Trinity A1: posible turbo core 3.0 entre 300 a 900 MHz
Ya es un hecho que los planes para el lanzamiento de Trinity, la segunda
generación de APU de alto rendimiento de AMD, sea
lanzado los primeros meses del 2012. Desde semiaccurate nos comentan que
este nuevo APU podría mostrar sus atributos en versiones para PCs desktop en la
CES 2012 (enero) y que sus frecuencias bajo turbo core 3.0 tendrían diferentes
estados por sobre la frecuencia stock, entre 300 a 900 MHz.
La primera revisión A1 (Engineering Sample) de Trinity ya anda dando vueltas en los pasillos de AMD. Lo bueno es
que esta versión de prueba estaría entregando buenos resultados en frecuencias
bajo turbo core con rangos de 300 a 900 MHz por sobre la frecuencia stock, tal
como algunos modelos de FX Bulldozer actuales que manejan la tecnología TC 2.0.
Lo malo de esta versión es que el TDP aun sigue siendo alto y rondaría los
125W. Esto es algo que debiera mejorar necesariamente AMD con el paso del tiempo
y para
cuando salgan las versiones comerciales de Trinty, ya que Intel
posee un muy bajo
consumo en sus próximos CPUs Ivy Bridge.
Como hemos venido comentando los núcleos Pelidriver
(Bulldozer revisión 2) presentes en Trinity, arreglan algunos problemas
presentes en la actual arquitectura Bulldozer y entregarían
de un 10 a 15% más de performance o IPC(Instructions per cycle) bajo el mismo
TDP, según AMD. Este incremento ayudado por frecuencias más altas -estimamos
que de 3,4 GHz stock – y en gran medida por el turbo core 3.0, llegarán
al 20% más de performance que
Llano en CPU que pronostica AMD. Recordemos que Llano en su modelo tope de línea
no posee tecnología turbo core 2.0 para incrementar la velocidad bajo ciertos
estados y programas. Esto es algo que sí beneficiará a Trinity, por lo menos en
modelos de gama alta, brindándole un gran salto de rendimiento.
También debemos acotar que Trnity al igual que Llano no poseerá cache L3 lo que
le restará un poco de rendimiento al núcleo Pelidriver frente a uno con Cache
L3 que si estará integrado en Vishera, CPU que será el reemplazo de los
actuales Bulldozer FX.
Frecuencias masivas de Bulldozer: hasta 1GHz con
Turbo core
Se han liberado nuevas informaciones con respecto a
algunas características de los procesadores AMD FXcodename Zambezi. Estos nuevos CPUs trabajarán con la característica turbo core 2.0,
la que puede llegar hasta 1GHz por sobre la frecuencia stock cuando solo
un núcleo esta activo.
La nueva serie de procesadores AMD FX vendrá a reemplazar a los actuales Thuban X6. Estos últimos integran la primera versión de la tecnología AMD turbo core (símil de Intel turbo boost). Esta tecnología permite aumentar la frecuencia de una cierta cantidad de núcleos, cuando no todos estos están con demanda de trabajo. Con la nueva generación de procesador de AMD FX, basados en la arquitectura Bulldozer, esta tecnología llegará en su versión 2.0, la que permitirá subir la frecuencia stock de todos los núcleos. Pero esta tecnología incorpora un segundo estado de turbo core, la que es mucho más masiva y sorprendente en el aumento de las frecuencias al llegar hasta 1GHz por sobre la frecuencia stock, con la mitad de los núcleos activos.
Este increíble salto en frecuencias le
dará a AMD un incremento masivo MHz x MHz contra su principal rival Intel Sandy
Bridge, ya que le permite obtener un rendimiento fenomenal en aplicaciones que
no hagan uso de todos los núcleos (una de las falencias de la antigua
arquitectura), además de las mejoras en el IPC (instrucción per Clock). AMD FX-Zambezi
no solo obtendrá un significativo aumento bajo tareas multinúcleo, si no
también mono núcleo, versus su pasada arquitectura Thuban X6.
Probablemente las frecuencias stock para el tope de
línea de AMD FX-zambezi de 8 núcleos (FX-8130) este en los 3.2GHz, lo
que le permitiría un salto hasta los 4.2GHz en el segundo estado bajo turbo
core. El primer estado bajo turbo core, y que permite el aumento de frecuencia
de todos los núcleos, posiblemente este en los 400Mhz por sobre la
frecuencia stock, dándole los rumoreados 3.6GHz. AMD ha venido
trabajando estas masivas frecuencias desde sus primeros “ES” (muestras de
ingeniería) que mostrábamos en esta noticia hace tiempo atrás.
Para lograr los dos estados bajo turbo core y con
tan altos aumentos de frecuencias AMD ha trabajado duro y por ello ha tenido
que desechar los primeros dos stepping (B0 y
B1), pero ya
se prepara la tercera revisión B2 que contará con estas características de
frecuencias masivas bajo turbo core 2.0. AMD
FX-Zambezi estará disponible entre agosto-Septiembre del presente
año.
Bulldozer ya le empieza a hacer honor a la arquitectura Netburts de Intel que introdujo hace unos años
atrás y no es que AMD haya retrocedido en el tiempo en rendimiento (parece que
solo un poco), si no por sus altos clocks de funcionamiento. El
diseño, pensado así, lo permite y el nuevo FX-8170 lo refleja.
Este 12 de Octubre se lanzan, esperamos, los
nuevos AMD FX-Zambezi de la arquitectura Bulldozer capitaneados por el
buque insignia de la serie, el FX-8150. Este procesador ya alcanza
frecuencias descomunales de 4,2 GHz bajo turbo core (TC2 para la mitad de sus
núcleos) y pronto llegará la versión que lo reemplazará, el FX-8170. Este
modelo correrá a impresionantes 4,5 GHz en modo TC2, algo bastante alto
considerando que ningún procesador para escritorio ha alcanzado esos límites.
Este modelo lucirá todo lo que AMD pensó en cuanto a frecuencias, ya que
los rojos tuvieron en mente los altos clocks para superar el altísimo IPC
(instruction
per cycle) de Sandy bridge. El modelo posiblemente no sería un
reemplazo del FX-8150, ya que no se espera que este último dure tan poco, por lo
que tendrá un precio superior y se lanzará a principios del 2012.
Modelo
|
Núcleos/ Threads
|
MHz/ TC1/TC2
|
Cache L3
|
TDP
|
Precio
|
|
FX-8170
|
8/8
|
3,9/4,2/4,5 GHz
|
8 MB
|
125 W
|
<300 USD
|
|
FX-8150
|
8/8
|
3,6/3,9/4,2 GHz
|
8 MB
|
125 W
|
245 USD
|
La frecuencia stock de este modelo también será muy alta
acechando los 4 GHz y el TC1 para todos sus cores será de 4,2GHz prometiendo
muy buen rendimiento multi-core.
Un modelo con frecuencias brutales y que espera llegar a
combatir o superar al actual i7-2600K pero creemos que seguirá estando
por debajo del nuevo i7-2700K.
La conferencia anual “Hot Chips” ha dado inicio y uno de los
invitados es AMD, quien representado por Mark Papermaster (CTO), ha dado oficialmente los
primeros detalles de su nueva arquitectura Steamroller.
Este nuevo núcleo x86 verá la luz en el segundo Q del 2013 y ya promete
significativas mejoras versus su antecesor, Pelidriver. Además
AMD comienza a cerrar su circulo de la “Heterogeneous System
Architecture” (HSA),
agregando un nuevo concepto llamado “Surround Computing Era”
AMD esta viviendo cambios importantes con el paso de
nuevas arquitecturas, conceptos y tecnologías en su abanico de productos. Todos
enfocados a integrarse (tanto en hardware como en software) para permitirle
tener las nuevas armas de un mercado cada vez más complejo. Su concepto de HSA,
ecosistema de de software y hardware, ya se está ejecutando y el primer paso
fue la creación del APU. Ahora AMD agrega el concepto de “Surround Computing Era”, que no es más que el ecosistema
donde eete hardware ys software se puede ejecutar en nuestra vida diaria. Pero
para hacer realidad este mundo es necesaria la creación de un hardware potente
y que de las facilidades necesarias al desarrollo de aplicaciones que lo hagan
apetecible.
En un principio fue la “fusión” de GPU+CPU con Llano,
luego vino el perfeccionamiento y las bases de los futuros chips con Trinity y
ahora AMD espera dar un salto en rendimiento, gracias a la arquitectura
Steamroller. Con esta nueva arquitectura AMD espera estrenar de lleno su
ecosistema HSA, donde la GPU tiene un rol importante.
Como
sabemos, Bulldozer fue el diseño inicial de un CPU con muchas falencias pero
con una idea auténtica y con ganas de madurar intensamente con el paso de los
años. Piledriver es la primera mejora, prácticamente enfocada al consumo y a
unos cuantos ajustes menores. Pero Steamroller promete lo que cualquier afanado
a la computación espera, un salto importante en rendimiento. Por otro lado esta
arquitectura será el salto de los actuales 32nm a los 28nm.
Haciendo
cambios en la arquitectura modular
La
arquitectura modular de los actuales núcleos es un proyecto aun en desarrollo y
una de sus grandes falencias es el hardware compartido de lectura (fetch)
y decodificación (decode). Para los actuales núcleos (Bulldozer) tenemos un un
decodificador de instrucciones de cuatro vías que puede realizar hasta 16
instrucciones (8 cores), mientras que para los antiguos CPUs Phenom II (6
cores) o los actuales procesadores hexacore Intel, se pueden realizar 18 y 24
instrucciones. Steamroller mejorará esto con el doble de hardware en cada
módulo, lo que no significa el doble de rendimiento, pero si un porcentaje de
mejora teórico. Ahora cada núcleo tendrá
sus vías exclusivas de decodificación, pudiendo los
“decode” funcionar en paralelo en lugar de alterna cada dos ciclos (2 núcleos
en un módulo). En simples palabras, ya no habrá hardware compartido en el
módulo, sino que habrá hardware para cada núcleo del módulo.
Además se
hizo más eficiente la gran unidad de coma flotante compartida en cada módulo.
Eso si, no hay cambios en las capacidades de ejecución del FPU, pero se redujo
el área total y con ello se optimiza el rendimiento por watt. La unidad MMX
ahora comparte algo de HW con los “pipes” FMAC de 128-bits. AMD no dio mucha
información al respecto y sólo se informa de que ahora el hw que se comparte
sólo corresponde a operaciones MMX/FMA/FP, por lo que no habría mucho impacto
en el rendimiento.
La
reducción de recursos, ahora debería entregar el mismo rendimiento utilizando
una menor energía y área, lo que corresponde básicamente a una implementación
más inteligente del FPU Bulldozer/Piledriver.
En cuanto
a las unidades de enteros, no hay cambios pero hay otras mejoras que
hacen que el rendimiento aumente. Ahora los archivos de registro de enteros y
coma flotante serán más grandes en Steamroller, claro que la falta
de una información más detallada sólo nos haría especular de cuanto es el
aumento de tamaño. También se aumentaron de tamaño las ventanas de
programación/planificación (scheduling), lo que debería permitir una mejor utilización
de los recursos de ejecución existentes.
Mejorando
la Cache
Con
Bulldozer la cache L1 64KB 2-way, era compartida, siendo nuevamente esto un
problema. Cada “núcleo” utilizaba uno de estos “ways”, dándole menos
caché por núcleo. Esto Steamroller lo mejora con un crecimiento de la Caché
de instrucciones L1, pero nuevamente vamos a ciegos con números
concretos. Eso sí, AMD asegura que el incremento puede reducir pérdidas
de cache de instrucciones hasta en un 30%.
La
interfaz de L1 a L2 también fue mejorada. Algunas colas se agrandaron y la
lógica se mejoró.
Finalizando,
Steamroller introduce un caché L2 de tamaño dinámico, de acuerdo a la carga de
trabajo. Con ello un módulo puede elegir cambiar el tamaño de su caché L2 en
intervalos de 1/4. Esto, según AMD, permite no sólo mejorar el rendimiento,
sino que ayuda a mejorar el ahorro de energía. Aquí el CPU sólo tiene que
despertar por cortos periodos de tiempo para correr tareas menores que no
merman las grandes tareas que ejecuta la cache L2
Con esto
se le da una solución a los grandes gastos de energía que hace la Cache L2 al
no estar optimizada para un uso eficiente de recursos.
En cuanto
a la cache L3, AMD aun no ofrecerá mayores cambios con Steamroller, ya que esta
unidad tiene poco sentido especialmente en los APU para el sector móvil.
Además las cargas de trabajo en servidores no son muy sensibles a las
latencias, por ello (tanto L2 como L3) no ofrecerán una escalada en latencias
más apretadas. El foco de AMD estará por ahora en otro sector de la
arquitectura.
Otro de
los focos claros de AMD con el paso de cada arquitectura es la optimización del
uso de la energía, algo tan vital en los productos portátiles que hacen uso de
procesadores cada vez más potentes. Por ello, cada vez que AMD mejora un
aspecto de Steamroller, estará detrás la optimización y balanceo de la energía.
Esto es parte del mejor uso de recursos de automatización y la reducción de
áreas, lo que se traducirá en 15 – 30% de uso de menos energía por
operación. Pero también la reducción de energía se traduce ne clocks mas
bajos, algo que en portátiles no hace mucho impacto en el rendimiento. De todas
formas AMD mantendrá sus diseños Steamroller con ese “ki” de altas frecuencias
y seguramente veremos reales mejoras en el consumo en el próximo diseño
de arquitectura codename“Excavator”.
Conclusiones
AMD
espera realizar cambios significativos en su próxima arquitectura y ya vemos
como hace enfoque en las falencias de su actual arquitectura. Además por cada
re-implementación de la arquitectura modular, estará acompañada de una
optimización del consumo (otro punto bajo en Bulldozer). Esto es rendimiento/
watt mejorado. Algo al que muchos fabricantes apuntan, dado la vitalidad
de este aspecto hoy en día.
Si el
paso de Bulldozer a Pelidriver, fue la optimización en la mejora
energética, Steamroller estará más enfocado en la mejora de rendimiento y
la educción de áreas. Con esto podemos esperar un salto importante en el IPC,
además de un die mucho menor, tanto por la reducción de tamaño (menos
transistores) como por el paso al nuevo proceso de fabricación en 28nm.
Pero la
pregunta que muchos se harán es si estas mejoras serán suficientes para hacer
frente a Intel Haswell.
0 comentarios:
Publicar un comentario