jueves, 30 de agosto de 2012

Mas Procesadores AMD 2


Mas Tipos De Procesadores De AMD
3 Parte 

AMD Trinity A1: posible turbo core 3.0 entre 300 a 900 MHz


Ya es un hecho que los planes para el lanzamiento de Trinity, la segunda generación de APU de alto rendimiento de AMD, sea lanzado los primeros meses del 2012. Desde semiaccurate nos comentan que este nuevo APU podría mostrar sus atributos en versiones para PCs desktop en la CES 2012 (enero) y que sus frecuencias bajo turbo core 3.0 tendrían diferentes estados por sobre la frecuencia stock, entre 300 a 900 MHz.
La primera revisión A1 (Engineering Sample) de Trinity ya anda dando vueltas en los pasillos de AMD. Lo bueno es que esta versión de prueba estaría entregando buenos resultados en frecuencias bajo turbo core con rangos de 300 a 900 MHz por sobre la frecuencia stock, tal como algunos modelos de FX Bulldozer actuales que manejan la tecnología TC 2.0. Lo malo de esta versión es que el TDP aun sigue siendo alto y rondaría los 125W. Esto es algo que debiera mejorar necesariamente AMD con el paso del tiempo y para cuando salgan las versiones comerciales de Trinty, ya que Intel posee un muy bajo consumo en sus próximos CPUs Ivy Bridge.



Como hemos venido comentando los núcleos Pelidriver (Bulldozer revisión 2) presentes en Trinity, arreglan algunos problemas presentes en la actual arquitectura Bulldozer y entregarían de un 10 a 15% más de performance o IPC(Instructions per cycle) bajo el mismo TDP, según AMD. Este incremento ayudado por frecuencias más altas -estimamos que de 3,4 GHz stock – y en gran medida por el turbo core 3.0, llegarán al 20% más de performance que Llano en CPU que pronostica AMD. Recordemos que Llano en su modelo tope de línea no posee tecnología turbo core 2.0 para incrementar la velocidad bajo ciertos estados y programas. Esto es algo que sí beneficiará a Trinity, por lo menos en modelos de gama alta, brindándole un gran salto de rendimiento. También debemos acotar que Trnity al igual que Llano no poseerá cache L3 lo que le restará un poco de rendimiento al núcleo Pelidriver frente a uno con Cache L3 que si estará integrado en Vishera, CPU que será el reemplazo de los actuales Bulldozer FX.


 Frecuencias masivas de Bulldozer: hasta 1GHz con Turbo core


Se han liberado nuevas informaciones con respecto a algunas características de los procesadores AMD FXcodename Zambezi. Estos nuevos CPUs trabajarán con la característica turbo core 2.0,  la que puede llegar hasta 1GHz por sobre la frecuencia stock cuando solo un núcleo esta activo.

La nueva serie de procesadores
 AMD FX vendrá a reemplazar a los actuales Thuban X6. Estos últimos integran la primera versión de la tecnología AMD turbo core (símil de Intel turbo boost). Esta tecnología permite aumentar la frecuencia de una cierta cantidad de núcleos, cuando no todos estos están con demanda de trabajo. Con la nueva generación de procesador de AMD FX, basados en la arquitectura Bulldozer, esta tecnología llegará en su versión 2.0, la que permitirá subir la frecuencia stock de todos los núcleos.  Pero esta tecnología incorpora un segundo estado de turbo core, la que es mucho más masiva y sorprendente en el aumento de las frecuencias al llegar hasta  1GHz por sobre la frecuencia stock,  con la mitad de los núcleos activos.




Este increíble salto en frecuencias le dará a AMD un incremento masivo MHz x MHz contra su principal rival Intel Sandy Bridge, ya que le permite obtener un rendimiento fenomenal en aplicaciones que no hagan uso de todos los núcleos (una de las falencias de la antigua arquitectura), además de las mejoras en el IPC (instrucción per Clock). AMD FX-Zambezi no solo obtendrá un significativo aumento bajo tareas multinúcleo, si no también mono núcleo, versus su pasada arquitectura Thuban X6.
Probablemente las frecuencias stock para el tope de línea de AMD FX-zambezi de 8 núcleos (FX-8130) este en los 3.2GHz, lo que le permitiría un salto hasta los 4.2GHz en el segundo estado bajo turbo core. El primer estado bajo turbo core, y que permite el aumento de frecuencia de todos los núcleos, posiblemente este en los 400Mhz por sobre la frecuencia stock, dándole los rumoreados 3.6GHz.  AMD ha venido trabajando estas masivas frecuencias desde sus primeros “ES” (muestras de ingeniería) que mostrábamos en esta noticia hace tiempo atrás.



Para lograr los dos estados bajo turbo core y con tan altos aumentos de frecuencias AMD ha trabajado duro y por ello ha tenido que desechar los primeros dos stepping (B0 y B1), pero ya se prepara la tercera revisión B2 que contará con estas características de frecuencias masivas bajo turbo core 2.0. AMD FX-Zambezi estará disponible entre agosto-Septiembre del presente año.






Bulldozer ya le empieza a hacer honor a la arquitectura Netburts de Intel que introdujo hace unos años atrás y no es que AMD haya retrocedido en el tiempo en rendimiento (parece que solo un poco), si no por sus altos clocks de funcionamiento. El diseño, pensado así, lo permite y el nuevo FX-8170 lo refleja.
Este 12 de Octubre se lanzan, esperamos, los nuevos AMD FX-Zambezi de la arquitectura Bulldozer capitaneados por el buque insignia de la serie, el FX-8150. Este procesador ya alcanza frecuencias descomunales de 4,2 GHz bajo turbo core (TC2 para la mitad de sus núcleos) y pronto llegará la versión que lo reemplazará, el FX-8170. Este modelo correrá a impresionantes 4,5 GHz en modo TC2, algo bastante alto considerando que ningún procesador para escritorio ha alcanzado esos límites. Este modelo lucirá  todo lo que AMD pensó en cuanto a frecuencias, ya que los rojos tuvieron en mente los altos clocks para superar el altísimo IPC (instruction per cycle) de Sandy bridge. El modelo posiblemente no sería un reemplazo del FX-8150, ya que no se espera que este último dure tan poco, por lo que tendrá un precio superior y se lanzará a principios del 2012.

Modelo
Núcleos/ Threads
MHz/ TC1/TC2
Cache L3
 TDP
Precio
FX-8170
8/8
3,9/4,2/4,5 GHz
8 MB
125 W
<300 USD
FX-8150
8/8
3,6/3,9/4,2 GHz
8 MB
125 W
  245 USD

La frecuencia stock de este modelo también será muy alta acechando los 4 GHz y el TC1 para todos sus cores será de 4,2GHz prometiendo muy buen rendimiento multi-core.
Un modelo con frecuencias brutales y que espera llegar a combatir  o superar al actual i7-2600K pero creemos que seguirá estando por debajo del nuevo i7-2700K.



La conferencia anual “Hot Chips” ha dado inicio y uno de los invitados es AMD, quien representado por Mark Papermaster (CTO), ha dado oficialmente los primeros detalles de su nueva arquitectura Steamroller. Este nuevo núcleo x86 verá la luz en el segundo Q del 2013 y ya promete significativas mejoras versus su antecesor, Pelidriver. Además AMD comienza a cerrar su circulo de la “Heterogeneous System Architecture” (HSA), agregando un nuevo concepto llamado “Surround Computing Era”
AMD esta viviendo cambios importantes con el paso de nuevas arquitecturas, conceptos y tecnologías en su abanico de productos. Todos enfocados a integrarse (tanto en hardware como en software) para permitirle tener las nuevas armas de un mercado cada vez más complejo. Su concepto de HSA, ecosistema de de software y hardware, ya se está ejecutando y el primer paso fue la creación del APU. Ahora AMD agrega el concepto de “Surround Computing Era”, que no es más que el ecosistema donde eete hardware ys software se puede ejecutar en nuestra vida diaria. Pero para hacer realidad este mundo es necesaria la creación de un hardware potente y que de las facilidades necesarias al desarrollo de aplicaciones que lo hagan apetecible.
En un principio fue la “fusión” de GPU+CPU con Llano, luego vino el perfeccionamiento y las bases de los futuros chips con Trinity y ahora AMD espera dar un salto en rendimiento, gracias a la arquitectura Steamroller. Con esta nueva arquitectura AMD espera estrenar de lleno su ecosistema HSA, donde la GPU tiene un rol importante.





Como sabemos, Bulldozer fue el diseño inicial de un CPU con muchas falencias pero con una idea auténtica y con ganas de madurar intensamente con el paso de los años. Piledriver es la primera mejora, prácticamente enfocada al consumo y a unos cuantos ajustes menores. Pero Steamroller promete lo que cualquier afanado a la computación espera, un salto importante en rendimiento. Por otro lado esta arquitectura será el salto de los actuales 32nm a los 28nm.





Haciendo cambios en la arquitectura modular

La arquitectura modular de los actuales núcleos es un proyecto aun en desarrollo y una de sus grandes falencias es el hardware compartido de lectura (fetch) y decodificación (decode). Para los actuales núcleos (Bulldozer) tenemos un un decodificador de instrucciones de cuatro vías que puede realizar hasta 16 instrucciones (8 cores), mientras que para los antiguos CPUs Phenom II (6 cores) o los actuales procesadores hexacore Intel, se pueden realizar 18 y 24 instrucciones. Steamroller mejorará esto con el doble de hardware en cada módulo, lo que no significa el doble de rendimiento, pero si un porcentaje de mejora teórico. Ahora cada núcleo tendrá  sus vías exclusivas de decodificación, pudiendo los “decode” funcionar en paralelo en lugar de alterna cada dos ciclos (2 núcleos en un módulo). En simples palabras, ya no habrá hardware compartido en el módulo, sino que habrá hardware para cada núcleo del módulo.
Además se hizo más eficiente la gran unidad de coma flotante compartida en cada módulo. Eso si, no hay cambios en las capacidades de ejecución del FPU, pero se redujo el área total y con ello se optimiza el rendimiento por watt. La unidad MMX ahora comparte algo de HW con los “pipes” FMAC de 128-bits. AMD no dio mucha información al respecto y sólo se informa de que ahora el hw que se comparte sólo corresponde a operaciones MMX/FMA/FP, por lo que no habría mucho impacto en el rendimiento.
La reducción de recursos, ahora debería entregar el mismo rendimiento utilizando una menor energía y área, lo que corresponde básicamente a una implementación más inteligente del FPU Bulldozer/Piledriver.





En cuanto a las  unidades de enteros, no hay cambios pero hay otras mejoras que hacen que el rendimiento aumente. Ahora los archivos de registro de enteros y coma flotante serán  más grandes en Steamroller,  claro que la falta de una información más detallada sólo nos haría especular de cuanto es el aumento de tamaño. También se aumentaron de tamaño las ventanas de programación/planificación (scheduling), lo que debería permitir una mejor utilización de los recursos de ejecución existentes.







Mejorando la Cache

Con Bulldozer la cache L1 64KB 2-way, era compartida, siendo nuevamente esto un problema. Cada “núcleo” utilizaba uno de estos “ways”, dándole  menos caché por núcleo. Esto Steamroller lo mejora con un crecimiento de la Caché  de instrucciones L1, pero nuevamente  vamos a ciegos con números concretos. Eso sí,  AMD asegura que el incremento puede reducir pérdidas de cache de instrucciones hasta en un 30%.
La interfaz de L1 a L2 también fue mejorada. Algunas colas se agrandaron y la lógica se mejoró.
Finalizando, Steamroller introduce un caché L2 de tamaño dinámico, de acuerdo a la carga de trabajo. Con ello un módulo puede elegir cambiar el tamaño de su caché L2 en intervalos de 1/4. Esto, según AMD, permite no sólo mejorar el rendimiento, sino que ayuda a mejorar el ahorro de energía. Aquí el CPU sólo tiene que despertar por cortos periodos de tiempo para correr tareas menores que no merman las grandes tareas que ejecuta la cache L2
Con esto se le da una solución a los grandes gastos de energía que hace la Cache L2 al no estar optimizada para un uso eficiente de recursos.
En cuanto a la cache L3, AMD aun no ofrecerá mayores cambios con Steamroller, ya que esta unidad  tiene poco sentido especialmente en los APU para el sector móvil. Además las cargas de trabajo en  servidores no son muy sensibles a las latencias, por ello (tanto L2 como L3) no ofrecerán una escalada en latencias más apretadas. El foco de AMD estará por ahora en otro sector de la arquitectura.





Otro de los focos claros de AMD con el paso de cada arquitectura es la optimización del uso de la energía, algo tan vital en los productos portátiles que hacen uso de procesadores cada vez más potentes. Por ello, cada vez que AMD mejora un aspecto de Steamroller, estará detrás la optimización y balanceo de la energía. Esto es parte del mejor uso de recursos de automatización y la reducción de áreas, lo que se traducirá en 15 – 30%  de uso de menos energía por operación.  Pero también la reducción de energía se traduce ne clocks mas bajos, algo que en portátiles no hace mucho impacto en el rendimiento. De todas formas AMD mantendrá sus diseños Steamroller con ese “ki” de altas frecuencias y seguramente veremos reales  mejoras en el consumo en el próximo diseño de arquitectura codename“Excavator”.




Conclusiones

AMD espera realizar cambios significativos en su próxima arquitectura y ya vemos como hace enfoque en las falencias de su actual arquitectura. Además por cada re-implementación de la arquitectura modular, estará acompañada de una optimización del consumo (otro punto bajo en Bulldozer). Esto es rendimiento/ watt mejorado. Algo al que muchos fabricantes apuntan, dado la vitalidad de este aspecto hoy en día.
Si el paso de Bulldozer a Pelidriver,  fue la optimización en la mejora energética, Steamroller estará más enfocado  en la mejora de rendimiento y la educción de áreas. Con esto podemos esperar un salto importante en el IPC, además de un die mucho menor, tanto por la reducción de tamaño (menos transistores) como por el paso al nuevo proceso de fabricación en 28nm.
Pero la pregunta que muchos se harán es si estas mejoras serán suficientes para hacer frente a Intel Haswell.




0 comentarios:

Publicar un comentario