Chargement...

Cloudflare ouvre la voie en amenant l'IA à la périphérie

Dans cet article :

  • Cloudflare démocratise l'IA avec une infrastructure basée sur GPU et des capacités de service de modèles.
  • Des partenariats stratégiques avec des géants de la technologie améliorent les offres d'IA de Cloudflare.
  • L’expansion mondiale rapide de Workers AI amène l’IA à la pointe du progrès, donnant ainsi du pouvoir aux développeurs du monde entier.

Cloudflare, le célèbre réseau de diffusion de contenu et plateforme de sécurité cloud, vise à rendre l'intelligence artificielle (IA) accessible aux développeurs du monde entier. Cloudflare a introduit une infrastructure basée sur GPU et des capacités de service de modèles, tirant parti de son réseau périphérique, ouvrant la voie à des modèles de base de pointe pour le grand public. Avec un simple appel d'API REST, n'importe quel développeur peut accéder à la plateforme d'IA de Cloudflare, marquant ainsi une étape importante vers la démocratisation de l'IA.

L'évolution du réseau Edge de Cloudflare

En 2017, Cloudflare a lancé Workers, une plateforme informatique sans serveur de pointe. Cette plate-forme innovante permet aux développeurs de créer des Service Workers JavaScript qui s'exécutent directement dans les emplacements périphériques de Cloudflare à travers le monde. Avec Workers, les développeurs peuvent modifier les requêtes et réponses HTTP d'un site, effectuer des requêtes parallèles et répondre directement depuis la périphérie. Cette approche simplifie le développement Web et améliore les performances, en s'alignant sur la norme W3C Service Workers.

Intégration de l'IA avec les travailleurs Cloudflare

L'essor de l'IA générative a incité Cloudflare à enrichir sa plateforme Worker avec des capacités d'IA. L'intégration de l'IA de Cloudflare se compose de trois éléments clés :

1. Workers AI : ce composant fonctionne sur les GPU NVIDIA au sein du réseau mondial de Cloudflare, permettant des modèles d'IA sans serveur. Avec un modèle de paiement à l'utilisation, les utilisateurs peuvent se concentrer sur leurs applications plutôt que sur la gestion de l'infrastructure, ce qui rend l'IA plus accessible et plus rentable.

2. Vectorize : la base de données vectorielles de Cloudflare, Vectorize, facilite une indexation et un stockage vectoriels rapides et rentables. Il prend en charge les cas d'utilisation qui nécessitent l'accès à des modèles opérationnels et à des données personnalisées, ajoutant ainsi de la polyvalence aux applications d'IA.

3. Passerelle AI : AI Gateway permet aux organisations de mettre en cache, de limiter le débit et de surveiller leurs déploiements d'IA dans les environnements d'hébergement. Il améliore l'observabilité, la limitation du débit et la mise en cache, réduisant ainsi les coûts tout en optimisant les performances des applications.

Partenariats stratégiques et catalogue de modèles

Cloudflare a noué des partenariats stratégiques avec des leaders du secteur, notamment NVIDIA, Microsoft, Hugging Face, Databricks et Meta, pour apporter l'infrastructure GPU et les modèles de base à son réseau périphérique. La plateforme héberge également des modèles d'intégration pour convertir du texte en vecteurs. Ces vecteurs sont stockés, indexés et interrogés à l'aide de Vectorize, ajoutant du contexte aux grands modèles de langage (LLM) et réduisant les hallucinations de réponse. AI Gateway améliore les performances en fournissant une observabilité, une limitation du débit et une mise en cache pour les modèles d'IA fréquemment interrogés.

Le catalogue de modèles de Cloudflare pour Workers AI propose les modèles de base les plus récents et les plus avancés. De Meta's Llama 2 à Stable Diffusion XL en passant par Mistral 7B, les développeurs peuvent accéder à une suite complète d'outils pour créer des applications modernes alimentées par l'IA générative.

Optimiser les modèles d'IA avec le runtime ONNX

En coulisses, Cloudflare utilise ONNX Runtime, un environnement d'exécution d'échange de réseau neuronal ouvert dirigé par Microsoft, pour optimiser l'exécution de modèles dans des environnements aux ressources limitées. Cette technologie, également utilisée par Microsoft pour exécuter des modèles de base sous Windows, garantit un déploiement efficace de l'IA dans divers environnements.

Les développeurs disposent de plusieurs options pour intégrer l'IA dans leurs applications via Cloudflare. Bien que JavaScript puisse être utilisé pour écrire du code d'inférence d'IA et le déployer sur le réseau périphérique de Cloudflare, les développeurs peuvent également invoquer des modèles d'IA via une simple API REST en utilisant le langage de leur choix. Cette flexibilité permet d'intégrer facilement l'IA générative dans les applications Web, de bureau et mobiles, quel que soit l'environnement.

Étendre l'IA des travailleurs à l'échelle mondiale

En septembre 2023, Cloudflare a lancé Workers AI avec des capacités d'inférence dans sept villes. Cependant, l'entreprise s'est fixé un objectif ambitieux : prendre en charge l'inférence Workers AI dans 100 villes d'ici la fin de l'année, avec une couverture quasi omniprésente attendue d'ici fin 2024. Cette expansion rapide garantit que les développeurs du monde entier peuvent exploiter la puissance de l'IA à le bord.

Cloudflare est l'un des premiers fournisseurs de réseaux de diffusion de contenu (CDN) et de réseaux de périphérie à améliorer son réseau de périphérie avec des capacités d'IA, optimisées par Workers AI, Vectorize et AI Gateway compatibles GPU. En collaboration avec des géants de la technologie comme Meta et Microsoft, Cloudflare propose un catalogue de modèles diversifié et exploite ONNX Runtime pour l'optimisation. Cette décision stratégique positionne non seulement Cloudflare comme un leader du secteur, mais ouvre également la voie à la démocratisation de l'IA à la pointe de la technologie.

L'engagement de Cloudflare à rendre l'IA accessible aux développeurs représente une étape importante dans le paysage de l'IA. En intégrant de manière transparente les capacités d'IA dans son réseau périphérique, Cloudflare permet aux développeurs d'exploiter l'IA générative dans leurs applications, stimulant ainsi l'innovation et élargissant la portée de l'IA. En mettant l’accent sur son expansion mondiale, Cloudflare est sur le point de prendre la tête de la démocratisation de l’IA au profit de tous les développeurs et utilisateurs.

Clause de non-responsabilité. Les informations fournies ne sont pas des conseils commerciaux. Cryptopolitan.com décline toute responsabilité pour les investissements effectués sur la base des informations fournies sur cette page. Nous tron vivement dent recherches indépendantes et/ou de consulter un professionnel qualifié avant de prendre toute décision d'investissement.

Lien de partage:

Les plus lus

Chargement des articles les plus lus...

Restez au courant de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte de réception

Nouvelles connexes

Qu'est-ce qui va exactement arriver Bitcoin cette semaine ?
cryptopolite
Abonnez-vous à CryptoPolitan