Microsoft anunció un pequeño modelo de lenguaje de inteligencia artificial que es capaz de realizar tareas como escribir publicaciones en redes sociales y crear contenido utilizando menos cantidades de datos.
El gigante tecnológico dijo en un comunicado que su nuevo modelo liviano llamado Phi-3-mini tiene la capacidad de superar a los modelos más grandes diez veces su tamaño cuando se prueban en una variedad de puntos de referencia como capacidades de codificación, matemáticas y lenguaje.
Phi-3 es una solución adecuada para pequeñas empresas
Microsoft dijo que este tipo de modelos más pequeños facilitan que las empresas más pequeñas con recursos limitados realicen tareas más simples, ya que están diseñados con este enfoque en mente.
Phi-3 podría ser utilizado por una empresa para trac información relevante y tendencias comerciales de informes de investigación de mercado y para recuperar y resumir los puntos principales de un documento extenso, explicó Microsoft.
Phi-3 estará disponible instantáneamente en el catálogo de modelos de IA de Azur, que es la plataforma de servicios en la nube de Microsoft, en Hugging Face, que es una plataforma de implementación y prueba de modelos de aprendizaje automático, y también en Ollama, que es una plataforma que proporciona marcos para modelos en funcionamiento.
Más modelos Phi-3 vendrán con más capacidades
Phi-3 es capaz de procesar 3.800 millones de parámetros y se entrena con bastante menos datos en comparación con modelos de lenguaje grandes como Gemini o GPT-4. Microsoft lanzó Phi-2 a finales del año anterior. Los expertos dicen que funcionó tan bien como algunos de los modelos más grandes. Se espera que Phi-3 funcione mucho mejor que su predecesor.
Microsoft planea presentar dos versiones más del modelo, ya que es la primera de la gama, un Phi-3 Small y un Phi-3 Medium, con diferentes capacidades de parámetros de siete a 14 mil millones.
El modelo liviano no puede generar resultados como los de los LLM basados en la nube, pero puede competir con otros modelos más pequeños como Mistral y llama-3 en la escritura de códigos, la resolución de ecuaciones matic y los artículos académicos.
Otro beneficio adicional del Phi-3 es que puede funcionar sin conexión a Internet y en dispositivos más pequeños como un teléfono celular. Phi-3 es una solución rentable para empresas más pequeñas que no pueden permitirse modelos de lenguaje grandes basados en la nube para ingresar a la IA.
Las noticias originales de Reuters se pueden ver aquí y el artículo de investigación de Microsoft está aquí .