Cohere, la startup canadiense de inteligencia artificial valorada en 5.500 millones de dólares, está girando hacia la creación de modelos de IA especializados para uso empresarial. El movimiento de la compañía se aleja de los modelos grandes tradicionales en los que invierten actualmente la mayoría de sus competidores.
El cofundador de Cohere, Nick Frosst, enfatizó que las empresas actuales necesitan modelos diseñados para tareas específicas en lugar de modelos genéricos que lo abarquen todo. El cambio estratégico hacia la creación de modelos personalizados se debe a que las empresas ven rendimientos decrecientes de sus modelos más grandes.
El problema de los rendimientos decrecientes de los modelos de IA a escala
Ilya Sutskever, cofundador de los laboratorios de IA Safe Superintelligence (SSI) y OpenAI, mencionó que los beneficios del entrenamiento de modelos de IA en grandes conjuntos de datos se han estancado. Las empresas ahora enfrentan retrasos en la capacitación y el despliegue de nuevas generaciones de grandes modelos lingüísticos.
La industria, que inicialmente vio avances al dedicar potencia y recursos computacionales a modelos más grandes, ha comenzado a reconocer que el tamaño no siempre es sinónimo de calidad o utilidad.
En una carta a sus inversores, Cohere dice que esta nueva dirección es el resultado de las dificultades de las empresas para incorporar la IA en su trabajo diario.
En lugar de perseguir la inteligencia artificial general (AGI), que algunas empresas como OpenAI ven como el futuro de la IA, Cohere está adoptando un enfoque más específico. La empresa pretende lograr una mayor eficiencia del capital optimizando los modelos existentes para aplicaciones del mundo real.
"Vamos a trabajar con empresas para crear modelos perfectos para su caso de uso, adaptarlos a sus necesidades específicas y llevarlos a producción", dijo Frosst.
Dejó claro que Cohere no se basaría en la noción de que AGI está a la vuelta de la esquina, y enfatizó que aumentar el tamaño del modelo no equivale a mejores resultados.
La carrera por construir mejores modelos
La carrera por construir modelos de IA mejores y más grandes ha provocado un auge de la inversión y el desarrollo en todo el sector. Cohere recaudó recientemente 270 millones de dólares en una financiación de Serie C, mientras que competidores como OpenAI, Anthropic y otros laboratorios de IA han recaudado miles de millones de dólares para financiar el proceso intensivo de capital de desarrollo de sistemas de IA de vanguardia, que a menudo requieren enormes cantidades de potencia computacional.
Según Cohere, pasó de construir modelos más grandes a modelos personalizados debido a la disminución de los rendimientos y a los comentarios que recibió de los clientes. “Lo que escuchamos de los clientes es que no sólo necesitan modelos más grandes para ser buenos en todo. Necesitan modelos que realmente estén diseñados para sus casos de uso específicos”, afirmó Frosst.
Cohere implementará versiones personalizadas de modelos existentes que pueden proporcionar valor directo a las empresas. Sus modelos estarán diseñados para comprender y ejecutar tareas altamente específicas adaptadas a los requisitos de cada empresa, en contraste con las capacidades generalizadas que a menudo se encuentran en modelos más grandes.
El nuevo enfoque de Cohere también puede alinearse con las tendencias de la industria en materia de sostenibilidad y rentabilidad. Dado que los gobiernos examinan cada vez más la huella de carbono de las empresas de tecnología, la estrategia de Cohere podría ofrecer una ventaja a la hora de navegar por el cambiante panorama regulatorio .
Desarrollar enormes modelos de IA no es sólo un negocio costoso; también consume mucha energía. Las empresas de IA pueden necesitar técnicas más eficientes desde el punto de vista energético para posicionarse mejor y cumplir con las regulaciones futuras a medida que los gobiernos presionan para reducir las emisiones y comprender mejor la tecnología.
Cable de diferencia de clave : la herramienta secreta que los proyectos de cifrado utilizan para obtener cobertura de medios garantizada