Logotipo horizontal de Diego C Martín colores invertidos, blanco y naranja para findo negro

Así es como puede utilizar el modelo de lenguaje pequeño de Microsoft que puede leer imágenes

Categorías:  Autor: Diego C Martin 

1. Microsoft anunció una nueva versión de su modelo de IA en lenguaje pequeño, Phi-3, llamado Phi-3-vision, capaz de analizar imágenes e identificar objetos.
2. Phi-3-vision es un modelo multimodal que puede leer tanto texto como imágenes, diseñado para su uso en dispositivos móviles con un modelo de 4,2 mil millones de parámetros.
3. Phi-3-vision puede realizar tareas generales de razonamiento visual, como analizar gráficos e imágenes, y está disponible en versión preliminar junto con otros modelos de Phi-3 en Azure Machine Learning con una cuenta paga de Azure.

Microsoft anunció una nueva versión de su modelo de IA en lenguaje pequeño, Phi-3, llamado Phi-3-vision durante la Build 2024. Este nuevo modelo multimodal está diseñado para analizar imágenes y decirle a los usuarios qué hay en ellas. A diferencia de modelos más conocidos como DALL-E de OpenAI, Phi-3-vision solo puede “leer” una imagen y no puede generar imágenes. El modelo presenta 4,2 mil millones de parámetros y está diseñado para su uso en dispositivos móviles.

Phi-3-vision es parte de una serie de pequeños modelos de IA lanzados por Microsoft, que están destinados a ejecutarse localmente en una gama más amplia de dispositivos sin conexión a Internet. Estos modelos también reducen la potencia informática necesaria para determinadas tareas, como resolver problemas matemáticos con el modelo Orca-Math de Microsoft. Phi-3-vision puede realizar tareas generales de razonamiento visual, como analizar gráficos e imágenes.

La primera versión de Phi-3, Phi-3-mini, se lanzó en abril y tuvo un buen desempeño en las pruebas de referencia contra modelos más grandes como Meta’s Llama 2. También hay modelos Phi-3-pequeño y Phi-3-mediano con 7 mil millones. y 14 mil millones de parámetros, respectivamente. Phi-3-vision está actualmente disponible en versión preliminar, mientras que se puede acceder a los otros modelos Phi-3 a través del catálogo de modelos de Azure Machine Learning con una cuenta paga de Azure y un centro de Azure AI Studio.

Enlace fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Artículos de la misma categoría

crossmenu
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram