IBM ha ofrecido algunos detalles de la arquitectura de su próximo procesador, Telum II, y del acelerador IBM Spyre durante el evento Hot Chips 2024, asegurando que las nuevas tecnologías están diseñadas para escalar la capacidad de procesamiento en los sistemas mainframe IBM Z de próxima generación, “lo que ayuda a acelerar el uso de modelos de IA tradicionales y modelos de IA de lenguaje grande en conjunto a través de un nuevo método de conjunto de IA”.
Según un estudio de Morgan Stanley, las demandas de energía de la IA generativa se dispararán un 75 % anual durante los próximos años, por lo que “las decisiones arquitectónicas para respaldar modelos de base de tamaño adecuado y enfoques híbridos por diseño para cargas de trabajo de IA son cada vez más importantes”.
Con el fin de ofrecer un mayor rendimiento y eficiencia, el procesador IBM Telum II ha sido diseñado con una mayor capacidad de memoria y caché, una unidad de procesamiento de datos dedicada para acelerar las tareas de E/S, y capacidades de aceleración de inteligencia artificial mejoradas, lo que lo convierte en una solución ideal para aplicaciones exigentes.
Desarrollado con la avanzada tecnología de 5 nm de Samsung, el procesador Telum II incorpora 8 núcleos de alto rendimiento que operan a una frecuencia de 5,5 GHz. Además, presenta un aumento del 40 % en la capacidad de caché, con una caché L3 virtual de 360 MB y una caché L4 virtual de 2,88 GB, lo que se traduce en un mayor rendimiento y eficiencia.
IBM Spyre Accelerator proporciona capacidad de cómputo de IA adicional para complementar el procesador Telum II. Explica la compañía que, al trabajar juntos, los chips Telum II y Spyre forman una arquitectura escalable para admitir métodos de modelado de IA en conjunto (la práctica de combinar múltiples modelos de IA de aprendizaje automático o aprendizaje profundo con LLM de codificador). Al aprovechar las fortalezas de cada arquitectura de modelo, la IA en conjunto puede proporcionar resultados más precisos y sólidos en comparación con los modelos individuales. El chip IBM Spyre Accelerator, presentado en la conferencia Hot Chips 2024, se entregará como una opción adicional. Cada chip acelerador se conecta a través de un adaptador PCIe de 75 vatios y se basa en tecnología desarrollada en colaboración con IBM Research. Al igual que con otras tarjetas PCIe, Spyre Accelerator es escalable para adaptarse a las necesidades del cliente.
Según Tina Tarquinio, vicepresidenta de gestión de productos de IBM Z y LinuxONE, “el procesador Telum II y el acelerador Spyre están diseñados para ofrecer soluciones informáticas empresariales de alto rendimiento, seguras y con mayor eficiencia energética. Después de años de desarrollo, estas innovaciones se introducirán en nuestra plataforma IBM Z de próxima generación para que los clientes puedan aprovechar los LLM y la IA generativa a escala”.