Comment les réseaux neuronaux convolutifs apprennent à partir d'entrées visuelles

By Brian Koome
Mise à jour : 7 octobre 2023 à 10 h 21 UTC

6 minutes de lecture

Ajoutez-nous comme source privilégiée sur Google

369380

Contenu

1. Que sont les réseaux neuronaux ?

2. Que sont les réseaux neuronaux convolutifs (CNN) ?

3. Comment fonctionnent les CNN ?

4. Types de réseaux neuronaux convolutifs

5. Avantages de l'utilisation des CNN

6. Inconvénients et défis

7. Conclusion

Partager le lien :

Avec les progrès de l'apprentissage automatique et de l'intelligence artificielle, une technologie se distingue par son remarquable succès dans le traitement des données visuelles : les réseaux de neurones convolutifs (CNN). Ces formes spécialisées de réseaux de neurones transforment des secteurs entiers, de l'imagerie médicale aux véhicules autonomes, grâce à leur capacité unique à apprendrematicà partir d'entrées visuelles.

Vous vous demandez ce que sont les réseaux de neurones convolutifs ? En quoi diffèrent-ils des réseaux de neurones traditionnels ? Pourquoi sont-ils la technologie de prédilection pour le traitement des données visuelles ? Ne cherchez plus. Ce guide examine en détail les CNN, leur fonctionnement, leurs différentes architectures, ainsi que leurs points forts et leurs points faibles.

Que sont les réseaux neuronaux ?

Une solide compréhension des réseaux de neurones en général est essentielle avant de se plonger dans le domaine spécialisé des réseaux de neurones convolutifs. En tant que base de nombreux algorithmes d'apprentissage automatique, les réseaux de neuronesdentdes modèles dans les données.

Le concept de réseaux neuronaux trouve son origine dans la biologie, et plus précisément dans l'architecture et le fonctionnement du cerveau humain. En apprentissage automatique, les réseaux neuronaux visent à imiter la capacité du cerveau à acquérir des connaissances à partir de l'expérience.

Chaque réseau neuronal comprend trois couches centrales :

Couche d'entrée : Les données initiales pour le calcul sont ingérées par cette couche.
Couches cachées : des calculs complexes et l’extraction de caractéristiques trac lieu au sein de ces couches. Leur nombre peut varier, créant ainsi des variantes « superficielles » ou « profondes » de réseaux neuronaux.
Couche de sortie : ici, le réseau neuronal parvient à une prédiction ou une conclusion finale basée sur les données qu’il a analysées et sur l’apprentissage qu’il a réalisé.

Un réseau de neurones fonctionne en recevant un ensemble d'entrées, en effectuant des opérations dans ses couches cachées à l'aide de poids variables (affinés lors de la phase d'apprentissage), et en générant une sortie. Il compare cette sortie au résultat attendu et met à jour les poids du modèle en fonction de l'écart ou « erreur ». Ce processus se répète jusqu'à ce que le réseau atteigne des performances optimales.

Les réseaux neuronaux sont incroyablement polyvalents et trouvent des applications dans de nombreux secteurs. Ils sont utilisés dans des domaines aussi variés que le traitement du langage naturel, les prévisions boursières et l'dentd'éléments visuels dans les images. Leur adaptabilité en fait la solution de choix pour de nombreux problèmes et types de données.

Que sont les réseaux neuronaux convolutifs (CNN) ?

Après avoir acquis une solide compréhension des réseaux neuronaux, il est temps de se concentrer sur un type spécialisé de réseau neuronal qui a révolutionné le domaine de la vision par ordinateur : les réseaux neuronaux convolutifs, ou CNN.

L'architecture unique des CNN les distingue des réseaux de neurones traditionnels, ou « classiques ». Les CNN apprennentmaticet de manière adaptative les hiérarchies spatiales des caractéristiques des images d'entrée. Cette caractéristique les rend particulièrement adaptés à diverses tâches de reconnaissance et d'analyse d'images.

Les composants des CNN comprennent :

Couches de convolution

Au cœur de chaque réseau de neurones convolutif (CNN) se trouve la couche de convolution qui applique des filtres aux données d'entrée. Ces filtres, ou « noyaux », sont essentiels à la détection et à l'tracde caractéristiques. Par exemple, les premières couches de convolution peuvent détecter les contours, tandis que les couches plus profondes peuventdentdes structures plus complexes.

Couches ReLU

Après chaque opération de convolution, une couche ReLU (Rectified Linear Unit) introduit une non-linéarité. Cette couche ReLU améliore la capacité d'apprentissage du réseau.

Couches de mise en commun

Les couches de pooling réduisent la charge de calcul tout en préservant les caractéristiques essentielles. Ces couches sous-échantillonnent la carte de caractéristiques tout en conservant les informations vitales.

Couches entièrement connectées

La dernière étape d'une architecture CNN comprend une ou plusieurs couches entièrement connectées. Ces couches aplatissent les cartes de caractéristiques bidimensionnelles en un seul vecteur, permettant ainsi de réaliser des tâches de classification.

Comment fonctionnent les CNN ?

Comprendre les subtilités des CNN peut s'avérer complexe, mais le processus devient simple une fois décomposé. En résumé, les CNN suivent une série d'étapes pour transformer une image d'entrée en une étiquette de sortie, indiquant généralement l'objet présent dans l'image. Cette section vous guidera tout au long de ce processus de transformation, en présentant en détail chaque étape.

Voir aussi : Devriez-vous investir dans les meilleures cryptomonnaies NFT ?

La première étape importante du fonctionnement d'un réseau de neurones convolutif (CNN) est l'tracde caractéristiques. L'image d'entrée traverse une série de couches convolutives. Durant ce processus, des filtres permettent de détecter les contours, les angles, les textures, ou des structures plus complexes lors des étapes ultérieures. Ces caractéristiques sont essentielles pour la reconnaissance des différents aspects de l'objet ou de la scène présentés dans l'image.

Après la couche de convolution vient la couche ReLU (Rectified Linear Unit). Cette dernière applique une fonction non linéaire aux cartes de caractéristiques produites par les couches de convolution. Ce processus améliore la capacité du réseau à apprendre des données d'entrée en introduisant de la complexité et en l'aidant à gérer les relations non linéaires au sein des données.

La réduction de dimensionnalité est une étape cruciale du fonctionnement des CNN et intervient généralement après la couche ReLU. Une couche de pooling, le plus souvent utilisant la technique du max-pooling, est appliquée pour réduire la dimensionnalité des cartes de caractéristiques, rendant ainsi le réseau plus maniable et plus efficace en termes de calcul. Cette phase conserve les caractéristiques essentielles tout en éliminant les données redondantes, préparant ainsi le réseau aux étapes finales de classification.

Les cartes de caractéristiques issues des étapes précédentes sont aplaties en un vecteur unidimensionnel et transmises à travers une ou plusieurs couches entièrement connectées. Ces couches interprètent les caractéristiquestracpar les couches de convolution et déterminent l'étiquette de l'image.

Types de réseaux neuronaux convolutifs

Dans votre parcours pour maîtriser le domaine des réseaux neuronaux convolutifs (CNN), vous rencontrerez de multiples architectures conçues pour des applications diverses.

Modèles CNN Classic

Les modèles CNN originaux, ou «Classic», constituent la pierre angulaire des architectures CNN contemporaines. Ces architectures combinent des séquences de couches convolutionnelles, de pooling et denses pour s'attaquer à des tâches telles que l'dentd'objets dans des images. Par exemple, le modèle LeNet-5 a révolutionné notre conception des CNN.

Hybrides CNN-RNN

Bien qu'il ne s'agisse pas exclusivement d'un réseau de neurones convolutif (CNN), la fusion de réseaux de neurones convolutifs et de réseaux de neurones récurrents (RNN) offre une voie pour le traitement des données séquentielles ou temporelles. Dans ces modèles combinés, les CNN se concentrent généralement sur l'extraction de caractéristiques, tandis que les RNN sont spécialisés dans l'interprétation des données séquentielles. Cette combinaison est avantageuse pour des applications telles que l'analyse vidéo en temps réel ou le traitement du langage naturel.

Réseaux entièrement convolutifs (FCN)

Les réseaux de neurones convolutifs flous (FCN) se distinguent des réseaux de neurones convolutifs (CNN) traditionnels par l'élimination des couches connectées, ce qui les rend extrêmement adaptables et performants pour les images de tailles variables. Ces réseaux sont idéaux pour les tâches de haute précision telles que la segmentation d'images et la localisation d'objets, et sont entraînés intégralement.

Réseaux spatialement adaptatifs (STN)

Les réseaux adaptatifs spatiaux ajoutent une dimension spatiale dynamique aux CNN. Ils effectuent des transformations spatiales apprises sur les images d'entrée, améliorant ainsi la capacité du modèle àdentles objets à différentes échelles et orientations. Ils se révèlent précieux pour les tâches exigeantes sur le plan spatial, comme tracd'objets dans des séquences vidéo en temps réel.

Avantages de l'utilisation des CNN

Dans le paysage en constante évolution de l'intelligence artificielle et de l'apprentissage automatique, les réseaux de neurones convolutifs (CNN) se sont imposés, notamment en reconnaissance d'images et en vision par ordinateur. Cette section expliquera les avantages considérables du choix des CNN pour vos projets axés sur les données.

Invariance par translation

L'invariance par translation, sans doute l'une des caractéristiques les plus recherchées des CNN, permet à ces réseaux neuronaux de reconnaître des objets quelle que soit leur position dans l'image. Cet atout renforce l'adaptabilité du réseau, ce qui en fait une solution de choix pour les applications concrètes où le placement des objets est imprévisible.

Partage efficace des paramètres

Contrairement aux réseaux neuronaux traditionnels qui peuvent nécessiter un ensemble de paramètres distinct pour différentes régions d'une image, les CNN utilisent le partage de paramètres. Il en résulte un modèle plus léger et plus facile à gérer, capable de s'adapter rapidement et de généraliser efficacement à différents types de données.

Voir aussi la réglementation des NFT au Moyen-Orient : une riche mosaïque de stratégies

Apprentissage hiérarchique des caractéristiques

L'une des caractéristiques marquantes des CNN est leur capacité à apprendrematicet de manière adaptative les hiérarchies spatiales des caractéristiques. Les premières couches peuvent apprendre à détecter des aspects simples comme les contours, tandis que les couches plus complexes peuvent identifier des formes, voire des objets entiers. Cette approche à plusieurs niveaux permet des interprétations nuancées des données d'entrée, ce qui rend les CNN particulièrement adaptés aux tâches complexes.

Résistant aux changements mineurs

Les CNN possèdent la capacité innée de fonctionner de manière constante dans des environnements variés, faisant preuve d'une remarquable résilience face à des modifications mineures des données d'entrée, telles que des variations d'éclairage, de couleur ou même d'orientation des objets.

Formation de bout en bout

Les réseaux de neurones convolutifs (CNN) permettent un entraînement complet et de bout en bout, simplifiant ainsi le processus d'apprentissage. Cette approche cohérente facilite l'optimisation de tous les paramètres du réseau par rétropropagation, accélérant la courbe d'apprentissage globale du modèle.

Inconvénients et défis

Bien que les réseaux de neurones convolutifs (CNN) offrent des avantages considérables, il est essentiel d'être conscient de leurs limites et des défis qu'ils posent. Aussi efficaces soient-ils pour diverses applications, les CNN présentent des inconvénients. Cette section propose une analyse équilibrée des difficultés que vous pourriez rencontrer lors du déploiement de CNN.

Intensif en calcul

L'un des principaux obstacles à l'adoption des réseaux de neurones convolutifs (CNN) réside dans leur complexité de calcul, notamment pour les modèles vastes et complexes. L'entraînement d'un CNN peut s'avérer long et fastidieux, nécessitant une configuration matérielle performante et souvent des équipements spécialisés tels que des processeurs graphiques (GPU).

Dépendance des données

Les réseaux de neurones convolutifs (CNN) sont réputés pour leur forte consommation de données, notamment de données étiquetées. L'efficacité d'un modèle CNN est souvent directement proportionnelle à la quantité et à la qualité des données sur lesquelles il est entraîné, ce qui peut constituer une contrainte pour les projets disposant de jeux de données limités.

Risque de surapprentissage

Bien que les réseaux de neurones convolutifs (CNN) soient polyvalents, ils sont également sujets au surapprentissage, notamment lorsqu'ils traitent des ensembles de données restreints ou très spécialisés. Le surapprentissage se produit lorsque le modèle excelle sur les données d'entraînement mais ne parvient pas à généraliser à de nouvelles données non vues lors de l'entraînement.

Limites de la compréhension contextuelle

Bien que les réseaux de neurones convolutifs (CNN) excellent dans les tâches de traitement d'images, ils sont moins performants dans les scénarios exigeant une compréhension contextuelle plus approfondie, comme le traitement automatique du langage naturel (TALN). Leur architecture ne permet pas de gérer la complexité des tâches liées au langage et aux séquences.

Complexité dans la conception architecturale

Concevoir l'architecture d'un réseau de neurones convolutif (CNN) peut s'avérer complexe. Le nombre et le type de couches, ainsi que leur ordre d'organisation, sont autant de facteurs qui doivent être soigneusement étudiés pour optimiser les performances du réseau, ce qui exige une compréhension approfondie des principes fondamentaux des réseaux de neurones.

Conclusion

En conclusion, les réseaux de neurones convolutifs (CNN) ont profondément transformé l'apprentissage automatique moderne, notamment dans l'interprétation des données visuelles. Leur conception unique et leur capacité à appréhender les détails complexes en font des outils inégalés pour des applications concrètes, de la reconnaissance d'images numériques à l'exploration des limites de la robotique. Il est toutefois essentiel de noter qu'ils présentent des inconvénients tels qu'un coût de calcul élevé, un besoin important de données étiquetées et un risque de surapprentissage.

N'ayez crainte, les limitations des CNN sont loin d'être insurmontables. Nous pouvons pallier la plupart de ces difficultés grâce à l'amplification des données, au transfert d'apprentissage et aux techniques d'ajustement fin des modèles. La fusion des CNN avec d'autres catégories de réseaux neuronaux est également prometteuse pour les tâches exigeant une compréhension plus nuancée. À mesure que nous perfectionnons ces modèles avancés, la portée et l'efficacité des CNN pour résoudre des problèmes complexes ne feront que croître, les rendant ainsi plus indispensables dans le paysage technologique.

FAQ

Quels secteurs utilisent couramment les réseaux neuronaux convolutifs ?

Les réseaux neuronaux convolutifs (CNN) ne sont pas seulement destinés à la recherche universitaire ; dans le domaine de la santé, ils servent à l'analyse d'images médicales, dans le secteur automobile pour les voitures autonomes et dans le commerce de détail pour l'analyse du comportement des clients et la gestion des stocks.

Les CNN peuvent-ils traiter l'audio ou seulement les images ?

Bien que les réseaux de neurones convolutifs (CNN) soient le plus souvent associés au traitement d'images, ils peuvent effectuer des tâches de traitement du signal audio telles que la reconnaissance vocale ou la classification musicale. Cependant, des types de réseaux de neurones plus spécialisés, comme les réseaux de neurones récurrents (RNN), sont souvent mieux adaptés aux données séquentielles telles que l'audio.

Les réseaux de neurones convolutifs (CNN) fonctionnent-ils bien avec les images en noir et blanc ?

Oui, les réseaux de neurones convolutifs (CNN) fonctionnent bien avec les images en noir et blanc. Ces images nécessitent souvent moins de puissance de calcul car elles ne contiennent généralement qu'un seul canal de couleur au lieu des trois canaux (rouge, vert, bleu) des images couleur.

En quoi les CNN diffèrent-ils des algorithmes traditionnels de reconnaissance d'images ?

Les réseaux de neurones convolutifs (CNN) peuvent apprendrematicet de manière adaptative les hiérarchies spatiales des caractéristiques, une tâche généralement manuelle et fastidieuse pour les algorithmes traditionnels. Cette capacité d'apprentissage à partir des données confère aux CNN une grande efficacité et une excellente précision pour la reconnaissance d'images.

Les CNN sont-ils utilisés dans des applications en temps réel ?

Oui, les CNN sont utilisés dans des applications en temps réel telles que la vidéosurveillance, les systèmes de reconnaissance faciale et les jeux vidéo pour améliorer l'expérience utilisateur en rendant l'environnement de jeu plus interactif et réactif.

Les réseaux de neurones convolutifs (CNN) sont-ils suffisamment sécurisés ? Peuvent-ils être trompés ?

Bien que les réseaux de neurones convolutifs (CNN) soient robustes à bien des égards, ils ne sont pas totalement infaillibles. Ils peuvent être vulnérables aux « attaques adverses », où de petites distorsions intentionnelles des données d'entrée peuvent entraîner des résultats incorrects.

Partager le lien :

Lire l'avertissement

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. Cryptopolitan.com Cryptopolitan toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous vous recommandons vivement d’effectuer vos tron dent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Articles les plus lus

Restez informé(e) de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte mail

Choix de la rédaction

Chargement des articles sélectionnés par la rédaction...

Comment les réseaux neuronaux convolutifs apprennent à partir d'entrées visuelles

Contenu

Que sont les réseaux neuronaux ?

Que sont les réseaux neuronaux convolutifs (CNN) ?

Couches de convolution

Couches ReLU

Couches de mise en commun

Couches entièrement connectées

Comment fonctionnent les CNN ?

Types de réseaux neuronaux convolutifs

Modèles CNN Classic

Hybrides CNN-RNN

Réseaux entièrement convolutifs (FCN)

Réseaux spatialement adaptatifs (STN)

Avantages de l'utilisation des CNN

Invariance par translation

Partage efficace des paramètres

Apprentissage hiérarchique des caractéristiques

Résistant aux changements mineurs

Formation de bout en bout

Inconvénients et défis

Intensif en calcul

Dépendance des données

Risque de surapprentissage

Limites de la compréhension contextuelle

Complexité dans la conception architecturale

Conclusion

FAQ

Quels secteurs utilisent couramment les réseaux neuronaux convolutifs ?

Les CNN peuvent-ils traiter l'audio ou seulement les images ?

Les réseaux de neurones convolutifs (CNN) fonctionnent-ils bien avec les images en noir et blanc ?

En quoi les CNN diffèrent-ils des algorithmes traditionnels de reconnaissance d'images ?

Les CNN sont-ils utilisés dans des applications en temps réel ?

Les réseaux de neurones convolutifs (CNN) sont-ils suffisamment sécurisés ? Peuvent-ils être trompés ?

Partager le lien :

Articles les plus lus

Restez informé(e) de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte mail

Choix de la rédaction

Inscrivez-vous et restez au sommet

Suivez-nous

- La newsletter crypto qui vous donne une longueur d'avance -

Les marchés évoluent rapidement.

Nous avançons plus vite.

Entrez. Renseignez-vous. Prenez de l'avance.

Entrez. Renseignez-vous.
Prenez de l'avance.