ÚLTIMAS NOTICIAS

JPMorgan afirma que Bitcoin está reemplazando al oro en las operaciones de devaluación a medida que divergen los flujos de los ETF

de hace 4 horas Noticias
Arkham lleva la inteligencia en cadena a los mercados de predicción con su nueva suite analítica

de hace 4 horas Noticias
Las stablecoins evolucionan desde herramientas de comercio de criptomonedas hasta convertirse en infraestructura de pagos global

de hace 5 horas Noticias
Meta insta a Canadá a enmendar el proyecto de ley C-22 debido a preocupaciones sobre cifrado y vigilancia

de hace 6 horas Noticias

SELECCIONADO PARA TI

SEMANALMENTE

MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

Cerebras desafía a Nvidia al lanzar un servicio de inferencia de IA

Por

Aamir Sheikh

3 minutos de lectura 27 de agosto de 2024

Cerebras desafía a Nvidia al lanzar un servicio de inferencia de IA

Cerebras, un innovador fabricante de chips, ha presentado su propio servicio de inferencia de inteligencia artificial.
La compañía utilizará sus últimos chips Wafer Scale Engine, que son más rápidos que las GPU tradicionales.
Crebras ofrece el servicio a un precio mucho más asequible de 10 centavos por millón de tokens.

Cerebras Systems anunció el martes una solución de inferencia de IA para desarrolladores. Según la compañía, es mucho más rápida, 20 veces más rápida que las soluciones de Nvidia.

Cerebras proporcionará acceso a sus chips más grandes para ejecutar aplicaciones de IA, que, según la compañía, también son más económicas que las GPU de Nvidia. A las GPU de Nvidia, estándar de la industria, se suele acceder a través de proveedores de servicios en la nube para ejecutar modelos de lenguaje de gran tamaño como ChatGPT. Obtener acceso no suele ser fácil para muchas pequeñas empresas y resulta costoso.

Cerebras afirma que sus nuevos chips pueden ofrecer un rendimiento que supera a las GPU

La inferencia de IA es el proceso de operar un modelo de IA ya entrenado para obtener un resultado, como respuestas de chatbots y la resolución de diferentes tareas. Los servicios de inferencia son la columna vertebral de las aplicaciones de IA actuales, ya que dependen de ellos para las operaciones diarias y facilitar la tarea a los usuarios.

Cerebras afirmó que la inferencia es el segmento de mayor crecimiento en la industria de la IA, ya que representa el 40 % de todas las cargas de trabajo relacionadas con la IA en la computación en la nube. El director ejecutivo de Cerebras, Andrew Feldman, explicó que los chips de gran tamaño de la compañía ofrecen un rendimiento superior al de una GPU. Las GPU no pueden alcanzar este nivel, afirmó. Feldman habló con Reuters en una entrevista.

Añadió:

“Lo estamos haciendo con la máxima precisión y lo ofrecemos al precio más bajo”. Fuente: Reuters.

El director ejecutivo afirmó que los servicios de inferencia de IA existentes no satisfacen a todos los clientes. Comentó a otro grupo de periodistas en San Francisco que la compañía está observando un gran interés en soluciones más rápidas y rentables.

Hasta ahora, Nvidia ha dominado el mercado de la computación de IA con sus chips de referencia y el entorno de programación CUDA (Compute Unified Device Architecture). Esto ha permitido a Nvidia integrar a los desarrolladores en su ecosistema al ofrecer una amplia gama de herramientas.

Los chips Cerbras tienen 7000 veces más memoria que las GPU Nvidia H100

Cerebras afirmó que su servicio de inferencia de alta velocidad representa un punto de inflexión para la industria de la IA. Los nuevos chips de la compañía, del tamaño de un plato, se denominan Wafer Scale Engines. Pueden procesar 1000 tokens por segundo, una velocidad comparable, según la compañía, a la introducción del internet de banda ancha.

Según la compañía, los nuevos chips ofrecen diferentes niveles de salida para distintos modelos de IA. En el caso del Llama 3.1 8B, los nuevos chips pueden procesar hasta 1800 tokens por segundo, mientras que en el Llama 3.1 70B, pueden procesar 450 tokens por segundo.

Cerebras ofrece servicios de inferencia a 10 centavos por millón de tokens, una cifra inferior a la de los basados en GPU. Normalmente, los enfoques alternativos sacrifican precisión en beneficio del rendimiento, según la industria, mientras que los nuevos chips de Cerebras son capaces de mantener la precisión, según afirma la compañía.

Cerebras anunció que ofrecerá productos de inferencia de IA en diferentes formatos. La compañía planea introducir un servicio de inferencia a través de su nube y una clave de desarrollador. También venderá los nuevos chips a clientes de centros de datos y a quienes deseen operar sus propios sistemas.

Los nuevos chips Wafer Scale Engine cuentan con módulos integrados de refrigeración y suministro de energía, y forman parte del sistema de centro de datos CS-3 de Cerebras. Según diversos informes, el sistema Cerebras CS-3 es la columna vertebral del servicio de inferencia de la compañía.

El sistema cuenta con una capacidad de memoria 7000 veces mayor que las GPU Nvidia H100. Esto también resuelve el problema fundamental del ancho de banda de la memoria, que muchos fabricantes de chips intentan solucionar.

Cerbras también está trabajando para cotizar en bolsa. Para ello, presentó este mes un prospectodentante la Comisión de Bolsa y Valores (SEC).

Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Nvidia

Comparte este artículo

Descargo de responsabilidad. La información proporcionada no constituye asesoramiento financiero. Cryptopolitande no se responsabiliza de las inversiones realizadas con base en la información de esta página. Recomendamostrondentdentdentdentdentdentdentdent inversión.

Aamir Sheikh

Aamir es un periodista tecnológico especializado en tecnología y criptomonedas. Se graduó de la Universidad MAJ de Karachi con un MBA en Marketing y Finanzas. Escribe análisis de criptomonedas para Cryptopolitan desde 2021.

ÍNDICE

1. Cerebras afirma que sus nuevos chips pueden ofrecer un rendimiento que supera a las GPU

2. Los chips Cerbras tienen 7000 veces más memoria que las GPU Nvidia H100

Comparte este artículo

MÁS… NOTICIAS

MOSTRAR TODO

5 ingeniosas aplicaciones de ChatGPT y qué debes hacer al respecto

Hace 3 años, el técnico John Palmer

El 93% de los líderes empresariales prefieren soluciones basadas en IA para la gestión de la sostenibilidad de la marca, según Reuters

Hace 3 años, el técnico John Palmer

El ecosistema de inteligencia artificial de Francia

Así apoya Macron el vibrante y productivo ecosistema de IA de Francia

Hace 3 años Tech Glory Kaburu

Bloomberg estima que el mercado de IA generativa alcanzará los 1,3 billones de dólares en 2032

Hace 3 años, Tech Aamir Sheikh

¿Qué es Base? La red de capa 2 Ethereum lanzada por Coinbase

21 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Dogecoin vs. Bitcoin: Diferencias técnicas clave

20 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es TVL (valor total bloqueado) en criptomonedas?

14 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Cómo leer un documento técnico sobre criptomonedas?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Ripple vs. XRP vs. XRP Ledger: ¿Cuál es la diferencia?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es una billetera multifirma en criptomonedas?

10 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes

INTENSIVO CRIPTOMONEDAS
CURSO

¿Qué criptomonedas pueden hacerte ganar dinero?
Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
Estrategias de inversión poco conocidas que utilizan los profesionales
Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)