Cohere, la startup canadiense de inteligencia artificial valorada en 5.500 millones de dólares, se está centrando en la creación de modelos de IA especializados para uso empresarial. Esta iniciativa se aleja de los grandes modelos tradicionales en los que invierte la mayoría de sus competidores.
El cofundador de Cohere, Nick Frosst, enfatizó que las empresas actuales necesitan modelos diseñados para tareas específicas, en lugar de modelos genéricos y abarcativos. El cambio estratégico hacia la creación de modelos personalizados se debe a que las empresas experimentan una disminución en la rentabilidad de sus modelos más amplios.
El problema de los rendimientos decrecientes derivados de la ampliación de los modelos de IA
Ilya Sutskever, cofundador de los laboratorios de IA Safe Superintelligence (SSI) y OpenAI, mencionó que los beneficios del entrenamiento de modelos de IA con grandes conjuntos de datos se han estancado. Las empresas ahora enfrentan retrasos en el entrenamiento y la implementación de nuevas generaciones de grandes modelos de lenguaje.
La industria, que inicialmente vio avances al destinar potencia computacional y recursos a modelos más grandes, ha comenzado a reconocer que el tamaño no siempre es sinónimo de calidad o utilidad.
En una carta a sus inversores, Cohere dice que esta nueva dirección es el resultado de las dificultades de las empresas para incorporar IA en su trabajo diario.
En lugar de centrarse en la inteligencia artificial general (IAG), que algunas empresas como OpenAI consideran el futuro de la IA, Cohere adopta un enfoque más específico. La empresa busca lograr una mayor eficiencia de capital optimizando los modelos existentes para aplicaciones reales.
"Trabajaremos con empresas para crear modelos perfectos para su caso de uso, adaptarlos a sus necesidades específicas y llevarlos a producción", afirmó Frosst.
Fue claro al afirmar que Cohere no se basaría en la idea de que la IA general está a la vuelta de la esquina, y enfatizó que aumentar el tamaño del modelo no equivale a mejores resultados.
La carrera por construir mejores modelos
La carrera por construir modelos de IA más grandes y mejores ha impulsado un auge de la inversión y el desarrollo en todo el sector. Cohere recaudó recientemente 270 millones de dólares en una ronda de financiación de Serie C, mientras que competidores como OpenAI, Anthropic y otros laboratorios de IA han recaudado miles de millones de dólares para financiar el proceso de desarrollo de sistemas de IA de vanguardia, que requiere un alto nivel de capital y a menudo requiere una enorme capacidad computacional.
Según Cohere, la empresa pasó de crear modelos más grandes a modelos personalizados debido a la disminución de los rendimientos y a los comentarios de los clientes. "Lo que nos dicen los clientes es que no solo necesitan modelos más grandes para ser buenos en todo. Necesitan modelos diseñados específicamente para sus casos de uso", afirmó Frosst.
Cohere implementará versiones personalizadas de modelos existentes que pueden aportar valor directo a las empresas. Sus modelos estarán diseñados para comprender y ejecutar tareas muy específicas, adaptadas a las necesidades de cada empresa, a diferencia de las capacidades generalizadas que suelen encontrarse en modelos más grandes.
El nuevo enfoque de Cohere también podría alinearse con las tendencias de la industria en sostenibilidad y rentabilidad. Dado que los gobiernos examinan cada vez más la huella de carbono de las empresas tecnológicas, la estrategia de Cohere podría ofrecer una ventaja para adaptarse al cambiante panorama regulatorio .
Desarrollar enormes modelos de IA no solo es costoso, sino que también consume mucha energía. Las empresas de IA podrían necesitar técnicas más eficientes energéticamente para estar mejor preparadas y cumplir con las futuras regulaciones, a medida que los gobiernos buscan reducir las emisiones y comprender mejor la tecnología.

