Logotipo horizontal de Diego C Martín colores invertidos, blanco y naranja para findo negro

Métrica de Goodput como medida de la productividad del aprendizaje automático

Categorías:  Autor: Diego C Martin 
img-1

1. La precarga de contenedores acelera las operaciones de extracción de imágenes 29 veces en comparación con la línea base.
2. La caché de compilación persistente permite una reanudación más rápida del entrenamiento al guardar la caché de compilación en Cloud Storage.
3. Se utilizan kernels personalizados, descarga de host y técnicas de entrenamiento de precisión mixta Int8 para maximizar el programa Goodput para el entrenamiento de modelos a gran escala.

Se ha descubierto que la precarga de contenedores mejora significativamente las operaciones de extracción de imágenes, con un contenedor de 16 GB extrayendo imágenes 29 veces más rápido que la línea base. La caché de compilación persistente es crucial para evitar la recompilación en los bucles de entrenamiento y garantizar una reanudación eficiente del entrenamiento. GKE ha realizado avances en el rendimiento de la programación de trabajos para reducir el tiempo de reanudación.

Maximizar el Goodput del programa es esencial para una utilización eficiente de la computación en los programas de capacitación. El compilador XLA en AI Hypercomputer ofrece optimizaciones y API de escalado como GSPMD para mejorar el programa Goodput. Para mejorar Program Goodput, se han introducido núcleos personalizados con XLA, como Flash Attention para longitudes de secuencia más grandes y descarga de host para aprovechar la DRAM del host para recursos de memoria.

El entrenamiento de precisión mixta Int8 utilizando AQT es otra técnica para aumentar la eficiencia del entrenamiento sin comprometer la convergencia. Estas técnicas se han utilizado en conjunto para impulsar el buen rendimiento del programa para una implementación de LLM con una densidad de 128b utilizando MaxText, lo que muestra los beneficios de estas estrategias de optimización para los procesos de capacitación de IA.

Enlace fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Artículos de la misma categoría

crossmenu
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram