– OpenAI reveló GPT-4o antes de que Google anunciara las mejoras de Gemini, seguido de que Microsoft anunciara las PC Copilot+ y las mejoras de IA.
– Meta publicó un artículo de investigación sobre su modelo de IA multimodal Chameleon, afirmando que compite con modelos como Gemini, GPT-4 y Llama-2.
– Chameleon se basa en una arquitectura de modo mixto basada en tokens de fusión temprana, similar a Gemini de Google, y Meta ha estado impulsando iniciativas de código abierto para sus modelos de IA.
En la actual carrera armamentista entre empresas de tecnología en el espacio de la IA, OpenAI, Google, Microsoft y Meta han hecho anuncios importantes en las últimas dos semanas. OpenAI presentó GPT-4o, Google anunció mejoras en su modelo Gemini, Microsoft presentó las PC Copilot+ con mejoras de IA y Meta publicó discretamente un artículo de investigación sobre sus esfuerzos de IA multimodal.
El trabajo de investigación de Meta muestra su desarrollo de un modelo de lenguaje grande multimodal de última generación llamado Chameleon. Construido sobre una arquitectura de modo mixto basada en tokens de fusión temprana, Chameleon combina imágenes, código, texto y otras entradas para crear secuencias, similares al modelo Gemini de Google.
A diferencia de las arquitecturas multimodales de fusión tardía que fusionan modelos separados entrenados en modalidades únicas, Chameleon y Gemini se basan en arquitecturas de fusión temprana que aprenden de una combinación de entradas desde el principio. Se afirma que Chameleon es un modelo de extremo a extremo y compite de manera uniforme con otros modelos de IA como Gemini, GPT-4 y el propio Llama-2 de Meta.
El artículo sugiere que si las afirmaciones sobre Chameleon son ciertas y reproducibles, podría superar muchos modelos de IA existentes. El enfoque de Meta en iniciativas de código abierto, como el actual Llama 3 y la apertura del sistema operativo de auriculares Quest a los fabricantes de hardware, indica un compromiso con el avance de la tecnología de IA a través de la colaboración y la innovación.
Si bien la fecha de lanzamiento del modelo Chameleon sigue siendo incierta, Meta continúa avanzando en el desarrollo de la inteligencia artificial, con el reciente lanzamiento del asistente Llama 3 en Facebook, Instagram y WhatsApp. La dedicación de la empresa a la tecnología de vanguardia y las iniciativas de código abierto sugiere un futuro prometedor para los avances de la IA.