¡Deepseek AI V3, una aplicación con sede en China, es ahora la aplicación de inteligencia artificial gratuita (IA) mejor calificada en los Estados Unidos de América! Y por mucho que Sam Altman y su familia Operai lo estén jugando "tranquilos" y llamando al nuevo modelo "impresionante", están siendo maltratados en un juego que dominaron hasta el fin de semana pasado.
EE. UU. Vs. China o Deepseek vs Operai Sorteokes es una carrera acalorada para ocupar la cabeza de la mesa de IA. ¿Pero Sam Altman realmente está haciendo lo suficiente para el mercado estadounidense?
Bueno, si los usuarios, especialmente de los EE. UU ., Sienten que un modelo tecnológico de código abierto que usa una potencia computacional "favorable" y ha existido durante 2 semanas es mejor que el de ChatGPT -4.0, Altman está en problemas.
El 23 de enero, ChatGPT cayó por un par de horas; Los chistes volaron por las redes sociales que "la productividad también cayó". En ese momento, la 'competencia' era solo una palabra en el diccionario inglés para OpenAi.
Mucho ha cambiado desde entonces. El producto AI de una empresa china está en la cima de la montaña en los Estados Unidos.
Deepseek R1: Miedo a la fuente abierta Desconocida
A finales de 2022, Operai debutó ChatGPT, para consternación de un mercado chino de IA que no estaba listo. Los desarrolladores del país asiático se apresuraron a hacer chatbots a medias, tratando de igualar la tecnología capaz del gigante tecnológico. Ninguno de los productos que lanzaron, incluido Baidu, fue suficiente para satisfacer los requisitos y necesidades de los usuarios.
Poco más de tres meses después de diciembre de 2022, Deepseek fue fundada por el cofundador de AI Hedge Fund High Flyer Liang Wenfeng. Inicialmente arraigada en la Unidad de Investigación de AI de alto volante, la startup hizo la transición en abril de 2023 para concentrarse en modelos de idiomas grandes y la búsqueda de la inteligencia general artificial (AGI), un nivel de capacidad de IA que coincide o excede la inteligencia humana en diversas tareas.
Se sabe muy poco sobre Wenfeng; Los usuarios generalmente no necesitan saber mucho sobre el "quién". Les importa más los resultados, y en una comparación de lado a lado, los modelos de Deepseek están volando chatgpt fuera del agua.
A diferencia del chatgpt de OpenAi, Deepseek R1 cumple una promesa de que la OpenAi de Sam Altman una vez defendió; Abrir ai.
Ni siquiera la tormenta de las restricciones aprobadas del ex President Biden en las exportaciones de chips a China en los últimos tres años evitó que Deepseek entrenara sus últimos modelos. Estados Unidos quiere ser el epicentro de todo, y han intentado frustrar cualquier cosa que ayude a China a tomar la iniciativa.
Según una entrevista , el CEO de Scale AI, Alexandr Wang, alegó que Deepseek posee 50,000 chips Nvidia H100, que no proporcionó ninguna evidencia para apoyar.
"Lo que hemos encontrado es que Deepseek ... es el mejor desempeño, o más o menos a la par con los mejores modelos estadounidenses", comentó el CEO.
Wang también dijo que revelar los detalles violaría el llamado de Washington para prohibir las exportaciones de tales materiales avanzados a China.
Si bien se desconocen las cifras exactas sobre el costo de construcción de R1 o el número de GPU involucrados, los analistas de Jefferies sugieren que tenían un costo de capacitación de solo $ 5.6 millones, mucho menos que lo que Operai, Meta y la mayoría de las empresas estadounidenses presupuestan para un presupuesto de similares. operaciones.
La mera mención de Nvidia en todo el frenesí de Deepseek Ai puso a los fabricantes de chips en problemas; Una eliminación de precio el lunes era todo lo que necesitábamos para saber cómo se sentían los mercados estadounidenses.
¿El gobierno de los Estados Unidos teme tanto a China? Bueno, como el Presi dent Donald Trump le dijo a la BBC ayer, es una "llamada de atención".
Openai necesita hacerlo mejor
En una publicación del 28 de enero en X, el CEO de Openai, Altman, dijo que R1 de Deepseek es un "modelo impresionante", para ofrecer grandes resultados a bajos costos para los usuarios. Continuó prometiendo a sus seguidores que OpenAi lanzará mejores modelos y que la compañía agradece a la competencia.
“Obviamente, entregaremos modelos mucho mejores y también es una vigorización legítima tener un nuevo competidor! Subiremos algunos lanzamientos ”, publicó Altman.
R1 de Deepseek es un modelo impresionante, particularmente en torno a lo que pueden entregar por el precio.
¡Obviamente entregaremos modelos mucho mejores y también es legítimo tener un nuevo competidor! Subiremos algunos lanzamientos.
- Sam Altman (@sama) 28 de enero de 2025
Openai cobra $ 7.50 por millón de tokens de entrada por su modelo O1, mientras que Deepseek ofrece su modelo R1 con un descuento del 95%, solo $ 0.14 por millón de tokens.
En tareas de ingeniería de software, Deepseek R1 eclipsa estrechamente a OpenAi, anotando un 49.2% en la prueba resuelta verificada de SWE-Bench versus el 48.9% de OpenAI. También es hasta 50 veces más eficiente que liderar modelos de IA de EE. UU. Como Meta's Llama 3.1 y Claude 3.5 de Anthrope, utilizando mucho menos potencia informática para ofrecer resultados comparables o superiores.
¿Culparías a alguien por olvidarse de ChatGPT?
dent de Altman no es suficiente para ocultar vulnerabilidades en el modus operandi de OpenAi. A diferencia de Deepseek, Operai se ha resistido a adoptar completamente las prácticas de código abierto, una postura que ha generado críticas en una industria donde nada es más imperativo que la transparencia y la colaboración.
Justo antes de nuestros ojos, la suposición de que las compañías estadounidenses siempre liderarán la carrera de IA se está volcando por un competidor más ágil y rentable que opera fuera de la burbuja de Silicon Valley.
Si OpenAi, con GPT 5.0 o como se denomina el próximo modelo, no puede contrarrestar la tecnología de código abierto de Deepseek con algo que el mercado dará la bienvenida con los brazos abiertos, entonces el dominio de este último ya no es una predicción, es un spoiler.