1. GKE admite cargas de trabajo de IA a gran escala con Cloud TPU v5p y A3 Mega con tecnología de las GPU H100 de NVIDIA.
2. GKE mejora la rentabilidad de las cargas de trabajo de IA con la precarga de contenedores y modelos, el uso compartido de GPU y el almacenamiento en caché de lectura de GCS FUSE.
3. GKE mejora la facilidad de uso de las cargas de trabajo de IA con funciones como el Programador dinámico de cargas de trabajo, el piloto automático de GKE y la instalación automática del controlador de GPU.
Google Kubernetes Engine (GKE) es una opción popular para los clientes con cargas de trabajo de IA debido a su plataforma abierta, portátil, nativa de la nube y personalizable. El uso de GPU y TPU en GKE ha crecido significativamente durante el año pasado, lo que demuestra la creciente adopción de tecnologías de inteligencia artificial.
GKE ha creado innovaciones centradas en la escala, la rentabilidad y la facilidad de uso para los clientes que transforman sus negocios con IA. Las cargas de trabajo de IA a gran escala se admiten mediante aceleradores como Cloud TPU v5p y A3 Mega, lo que permite un entrenamiento más rápido de modelos grandes. La capacitación de múltiples segmentos en GKE permite una capacitación rentable y a gran escala con escalamiento casi lineal.
Para mejorar la rentabilidad, GKE ahora admite la precarga de contenedores y modelos, lo que reduce los tiempos de inicio en frío y mejora la utilización de la GPU. El uso compartido de GPU con el servicio multiproceso NVIDIA y el almacenamiento en caché de lectura GCS FUSE optimizan aún más el uso del acelerador de IA durante el entrenamiento del modelo.
La facilidad de uso de GKE se destaca a través de funciones como Dynamic Workload Scheduler y GKE Autopilot, que ahora admite GPU y TPU NVIDIA H100. La plataforma también integra IA en las operaciones en la nube a través de Gemini Cloud Assist, ofreciendo funciones para optimizar costos, resolución de problemas y monitoreo sintético.
Google Cloud continúa invirtiendo en áreas fundamentales para GKE, introduciendo nuevas capacidades como la detección de amenazas de GKE para ataques en tiempo de ejecución de contenedores y el cumplimiento de GKE para el escaneo automático de cumplimiento frente a puntos de referencia. Estas mejoras garantizan la estabilidad, la seguridad y el cumplimiento de las aplicaciones nativas de la nube para las empresas modernas.