Intel impulsa la investigación científica y el rendimiento de la nueva ola de superordenadores

razor · 14 Nov 2023

En SC23, Intel ha presentado informática de alto rendimiento (HPC, por sus siglas en inglés) acelerada por Inteligencia Artificial (IA) con un rendimiento líder para cargas de trabajo de HPC e IA a través de la serie Intel® Data Center GPU Max, los aceleradores de IA Intel® Gaudi®2 y los procesadores Intel® Xeon®. En colaboración con el Laboratorio Nacional Argonne, Intel ha compartido los avances del proyecto Aurora de inteligencia artificial generativa (genAI), incluida una actualización del GPT-3 LLM de un billón de parámetros en el superordenador Aurora, que es posible gracias a la arquitectura única de la GPU Max Series y las capacidades del sistema del superordenador Aurora. Intel y Argonne han demostrado la aceleración de la ciencia con aplicaciones del programa Aurora Early Science y el proyecto Exascale Computing. La compañía también mostró el camino hacia los aceleradores Intel® Gaudi®3 AI y Falcon Shores.

"Intel siempre se ha comprometido a ofrecer soluciones tecnológicas innovadoras para satisfacer las necesidades de la comunidad de HPC e IA. El gran rendimiento de nuestras CPU Xeon junto con nuestras GPU y CPU Max ayudan a impulsar la investigación y la ciencia. Esto, unido a nuestros aceleradores Gaudi, demuestra nuestra amplia gama de tecnologías para ofrecer a nuestros clientes opciones atractivas que se adapten a sus diversas cargas de trabajo". -- Deepak Patil, Intel corporate vice president and general manager of Data Center AI Solutions

Por qué es importante: La IA generativa para la ciencia, junto con los últimos resultados de rendimiento y pruebas comparativas, resaltan la capacidad de Intel para ofrecer soluciones a medida que satisfagan las necesidades específicas de los clientes de HPC e IA. El enfoque definido por software de Intel con oneAPI y los kits de herramientas mejorados para HPC e IA ayudan a los desarrolladores a adaptar sin problemas su códigos a través de marcos arquitectónicos para acelerar la investigación científica. Además, las GPU y CPU de la serie Max se instalarán en varios superordenadores que están a punto de entrar en funcionamiento.

Sobre la IA generativa para la ciencia: El Laboratorio Nacional Argonne compartió los avances de sus iniciativas de IA generativa para la ciencia con el superordenador Aurora. El proyecto Aurora genAI es una colaboración entre Argonne, Intel y otros socios para crear modelos fundacionales de IA para la ciencia. Los modelos se entrenarán con textos científicos, códigos y conjuntos de datos científicos a escalas de más de 1 billón de parámetros de diversos ámbitos científicos. Utilizando las tecnologías fundacionales de Megatron con DeepSpeed, el proyecto genAI prestará servicio a múltiples disciplinas científicas, como la biología, la investigación del cáncer, la climatología, la cosmología y la ciencia de los materiales.

La arquitectura distintiva de la GPU Intel Max Series y las capacidades del sistema de supercomputación Aurora pueden manejar eficientemente modelos de 1 billón de parámetros con sólo 64 nodos, muchos menos de los que se necesitarían normalmente. El Laboratorio Nacional Argonne ejecutó cuatro instancias en 256 nodos, lo que demuestra la capacidad de ejecutar múltiples instancias en paralelo en Aurora, allanando el camino para escalar más rápidamente el entrenamiento de modelos de billones de parámetros con billones de tokens en más de 10.000 nodos.

Sobre Intel y el Laboratorio Nacional Argonne: Intel y el Laboratorio Nacional Argonne han demostrado la aceleración de la ciencia a escala que permiten las capacidades del sistema y la pila de software de Aurora.1 Entre los ejemplos de cargas de trabajo se incluyen:

La reconstrucción del conectoma cerebral es posible a escala con Connectomics ML, mostrando un rendimiento de inferencia competitivo en más de 500 nodos Aurora.
El sistema GAMESS (General Atomic and Molecular Electronic Structure System) ha demostrado un rendimiento dos veces superior con la GPU Intel Max en comparación con la Nvidia A100. Esto permite modelar complicados procesos químicos en el diseño de fármacos y catalizadores para desvelar los secretos de la ciencia molecular con el superordenador Aurora.
Hardware/Hybrid Accelerated Cosmology Code (HACC) ha demostrado funcionar en más de 1.500 nodos Aurora, lo que permite visualizar y comprender la física y la evolución del universo.
La aplicación de inferencia de IA para el cribado de fármacos, que forma parte del proyecto de ciencia temprana Aurora Drug Discovery (ESP), permite el cribado eficaz de grandes conjuntos de datos químicos al posibilitar el cribado de más de 20.000 millones de los compuestos más sintetizados en sólo 256 nodos.

Intel también mostró nuevas prestaciones de HPC e IA, así como optimizaciones de software en hardware y aplicaciones:

Intel y Dell han publicado los resultados de STAC-A2, un conjunto de pruebas de rendimiento independientes basadas en cargas de trabajo de análisis de riesgos de mercado del mundo real, que muestran un gran rendimiento para el sector financiero. En comparación con ocho GPU Nvidia H100 PCIe, cuatro GPU Intel® Data Center GPU Max 1550 obtuvieron un 26% más de rendimiento en Warm Greeks 10-100k-1260 y una eficiencia de espacio 4,3 veces superior.
La GPU Intel® Data Center Serie Max 1550 supera a la tarjeta Nvidia H100 PCIe en un promedio del 36% (1,36x) en diversas cargas de trabajo de HPC.
La serie Intel Data Center GPU Max ofrece compatibilidad mejorada con modelos de IA, incluidos múltiples modelos de lenguaje de gran tamaño (LLM) como GPT-J y LLAMA2.
La serie Intel® Xeon® CPU Max, el único procesador x86 con memoria de gran ancho de banda (HBM), ofreció un 19% más de rendimiento de media en comparación con el procesador AMD Epyc Genoa.
La semana pasada, MLCommons2 publicó los resultados de la prueba de referencia estándar del sector MLPerf training v3.1 para el entrenamiento de modelos de IA. Intel Gaudi2 demostró un salto de rendimiento significativo de 2 veces con la implementación del tipo de datos FP8 en el benchmark GPT-3 de entrenamiento v3.1.
- Intel presentará los aceleradores de IA Intel Gaudi3 en 2024. El acelerador de IA Gaudi3 se basará en la misma arquitectura de alto rendimiento que Gaudi2 y se espera que ofrezca el cuádruple de capacidad de cálculo (BF16), el doble de ancho de banda de red para un mayor rendimiento de escalabilidad horizontal y 1,5 veces más memoria HBM incorporada para gestionar fácilmente la creciente demanda de cálculo de alto rendimiento y alta eficiencia de los LLM sin degradación del rendimiento.
Los procesadores Intel® Xeon® de 5ª generación ofrecerán hasta 1,4 veces más rendimiento en aplicaciones HPC, como ha demostrado LAMMPS-Copper.
- Granite Rapids, un futuro procesador Intel Xeon, ofrecerá un mayor número de núcleos y aceleración integrada con Intel® Advanced Matrix Extensions y compatibilidad con módulos DIMM de rangos combinados multiplexores (MCR). Granite Rapids mejorará en 2,9 veces la inferencia de IA DeepMD+LAMMPS. MCR alcanza velocidades de 8.800 megatransferencias por segundo basadas en DDR5 y más de 1,5 terabytes por segundo de capacidad de ancho de banda de memoria en un sistema de dos zócalos, lo que resulta fundamental para alimentar el rápido crecimiento del número de núcleos de las CPU modernas y permitir eficiencia y flexibilidad.

Sobre NewProgress en oneAPI: Intel ha anunciado nuevas funciones para sus herramientas de desarrollo de software 2024 que impulsan el desarrollo de software abierto basado en la programación multiarquitectura oneAPI. Las nuevas herramientas ayudan a los desarrolladores a ampliar las nuevas capacidades de IA y HPC en las CPU y GPU de Intel con una cobertura más amplia, incluido un rendimiento más rápido y despliegues utilizando Python estándar para cargas de trabajo numéricas, y mejoras en el compilador que ofrecen una implementación casi completa de SYCL 2020 para mejorar la productividad y la descarga de código.

Además, el Texas Advanced Computing Center (TACC) anunció que su Centro de Excelencia oneAPI se centrará en proyectos que desarrollen y optimicen códigos de referencia de imágenes sísmicas. Intel fomenta un entorno en el que la innovación y la investigación en software y hardware hacen avanzar a la industria, con 32 Centros de Excelencia oneAPI en todo el mundo.

Qué es lo siguiente: Intel hizo hincapié en su compromiso con la IA y la HPC y destacó el impulso del mercado. Entre los nuevos despliegues de superordenadores con tecnologías de GPU y CPU Intel Max Series se incluyen sistemas como Aurora, Dawn Phase 1, SuperMUC-NG Phase 2, Clementina XX1 y otros. Entre los nuevos sistemas que incorporan aceleradores Intel Gaudi2 se incluye un gran superordenador de IA con Stability AI como cliente principal.

Este impulso será fundamental para Falcon Shores, la nueva generación de GPU de Intel para IA y HPC. Falcon Shores aprovechará la propiedad intelectual (IP) de Intel Gaudi e Intel Xe con una única interfaz de programación de GPU basada en oneAPI. Las aplicaciones creadas en los aceleradores de IA Intel Gaudi, así como en las GPU Intel Max Series actuales, podrán migrar con facilidad a Falcon Shores en el futuro

Intel impulsa la investigación científica y el rendimiento de la nueva ola de superordenadores

razor

Administrador Global del Foro

Estadísticas en línea

Forum statistics