En général, un Deep Neural Network a une couche d’entrée, une couche de sortie et au moins une couche entre les deux. Plus le nombre de couches est élevé, plus un réseau est dit « profond ». Chacune de ces couches effectue différents types de tri et de catégorisation spécifique dans un processus nommé « hiérarchie de caractéristique ». Pour mieux comprendre le fonctionnement d’un Deep Neural Network, il suffit d’observer le fonctionnement du cerveau humain. Plutôt que d’apprendre la structure du visage pour identifier les personnes, notre cerveau apprend à partir de la déviation d’un visage de base lui servant de modèle. Lorsque nous voyons un visage, le cerveau cherche à déterminer comment celui-ci diffère de ce modèle de référence. Les caractéristiques telles que les yeux, les oreilles ou les sourcils sont ainsi passées en revue en une fraction de seconde. Les différences entre le visage perçu et le modèle de visage « de base » sont quantifiées par un signal électrique dont la puissance varie. Toutes les déviations sont combinées pour produire un résultat.
Les différents nœuds du système sont similaires aux neurones du cerveau humain. Chaque couche est composée de plusieurs nœuds. Dès lors qu’ils sont touchés par stimuli, un processus se déclenche. Le réseau de neurones interprète les données collectées par des capteurs ou directement injectées par un programmeur. Ces données peuvent être des images, des textes ou même des sons qui seront ensuite convertis sous forme de valeurs numériques.
Les différentes données entre la couche d’entrée et la couche de sortie doivent être traitées progressivement pour résoudre une tâche ou établir une prédiction. La première couche du réseau reçoit les données et exécute un calcul de fonction d’activation pour produire un résultat. Il peut s’agir par exemple d’une prédiction de probabilité. Ce résultat est transmis à la couche suivante de neurones. La connexion entre deux couches successives est associée à un « poids ». Ce poids définit l’influence des données sur le résultat produit par la couche suivante et éventuellement pour le résultat final.