– Microsoft anuncia la familia Phi-3 de modelos de lenguaje pequeño (SLM) abiertos, que superan a los modelos más grandes en pruebas comparativas de lenguaje, codificación y matemáticas.
– El modelo Phi-3-mini con 3.8 mil millones de parámetros está disponible, seguido por Phi-3-small y Phi-3-medium.
– Los SLM ofrecen implementación en el dispositivo para experiencias de IA de baja latencia, con posibles casos de uso que incluyen sensores inteligentes, cámaras y equipos agrícolas.
Microsoft ha presentado la familia Phi-3 de modelos de lenguaje pequeño (SLM) que se dice que son muy capaces y rentables. Estos modelos han sido desarrollados utilizando un enfoque de capacitación innovador por parte de investigadores de Microsoft, lo que les permite superar a los modelos más grandes en lenguaje, codificación y puntos de referencia matemáticos. El primer modelo, Phi-3-mini, con 3.800 millones de parámetros, ahora está disponible en varias plataformas, como Azure AI Model Catalog y Hugging Face.
Microsoft destaca el cambio hacia una cartera de modelos en lugar de una sola categoría singular, lo que permite a los clientes elegir el mejor modelo para sus necesidades específicas. El vicepresidente de IA de Microsoft, Luis Vargas, destaca la importancia de combinar modelos pequeños y grandes para diferentes casos de uso. Los SLM ofrecen la ventaja de la implementación en el dispositivo para experiencias de IA de baja latencia sin necesidad de conectividad de red.
El innovador enfoque de generación y filtrado de datos de Microsoft, inspirado en los libros de cuentos para dormir, dio lugar a un salto de calidad en los SLM. La empresa ha seleccionado datos de entrenamiento de alta calidad, como los conjuntos de datos 'TinyStories' y 'CodeTextbook', que han mejorado significativamente el rendimiento y la capacidad de razonamiento de los modelos. A pesar de la cuidadosa selección de datos, Microsoft garantiza la aplicación de prácticas de seguridad adicionales para mitigar los riesgos de seguridad de la IA asociados con la versión Phi-3.
En general, la familia de SLM Phi-3 de Microsoft ofrece una alternativa convincente a los grandes modelos de lenguaje, proporcionando un rendimiento mejorado y capacidades de razonamiento sin los enormes costos computacionales. Al ofrecer una variedad de modelos y centrarse en datos de capacitación de alta calidad, Microsoft tiene como objetivo hacer que las soluciones de inteligencia artificial sean más accesibles para las empresas y aliviar las barreras de adopción.