– OpenAI lanzó una actualización de GPT-4-Turbo con respuestas mejoradas y capacidades de análisis
– El modelo incluye tecnología de visión AI para analizar contenido de video, imágenes y audio.
– La actualización tiene como objetivo optimizar los flujos de trabajo para los desarrolladores y eventualmente se agregará a aplicaciones para consumidores como ChatGPT.
OpenAI ha lanzado una actualización de su modelo de inteligencia artificial GPT-4-Turbo, que incluye tecnología de visión de IA para analizar contenido de video, imágenes y audio. Inicialmente disponibles solo para desarrolladores, estas funciones eventualmente llegarán a ChatGPT. Esta es la primera vez que desarrolladores externos pueden acceder a GPT-4-Turbo con tecnología de visión, lo que abre la puerta a nuevas aplicaciones y servicios en áreas como moda, codificación y juegos. La nueva versión incluye una fecha límite de datos ampliada de diciembre de 2023.
El objetivo de GPT-4-Turbo es mejorar los flujos de trabajo de los desarrolladores optimizando los procesos y creando aplicaciones más eficientes. El plan futuro es ampliar las capacidades de análisis de visión del modelo e integrarlas en aplicaciones de consumo como ChatGPT. Esto se alinea con el enfoque de Google con Gemini Pro 1.5, que actualmente está limitado a plataformas de desarrolladores. La actualización tiene como objetivo mejorar la experiencia del cliente empresarial hasta que se lance GPT-5.
Si bien GPT-4 no ha tenido un buen desempeño en pruebas comparativas recientes con modelos más nuevos como Claude 3 Opus y Gemini de Google, se espera que las actualizaciones solucionen este problema e introduzcan características atractivas para los usuarios empresariales. El modelo sigue ofreciendo una ventana de contexto de 128.000 tokens, adecuada para la mayoría de los casos de uso. OpenAI se centró anteriormente en el análisis de audio y la nueva actualización amplía las capacidades de video a una base de usuarios más amplia a través de ChatGPT. Es posible que los usuarios pronto puedan cargar videoclips cortos para que la IA resuma o identifique momentos clave.