Un système de vision hybride embarqué avec l’IA

La rédaction

il y a 5 ans

L’apprentissage profond ouvre de nouveaux champs d’application en matière de traitement d’image industriel, qui étaient jusqu’à présent inenvisageables, sinon au prix d’efforts considérables. La nouvelle approche, radicalement différente de la méthode de traitement d’image classique, engendre de nouvelles difficultés pour les utilisateurs, et il est nécessaire de reconsidérer la question. IDS présente par conséquent une solution de vision embarquée tout-en-un avec laquelle chaque utilisateur peut mettre en œuvre le traitement d’image basé sur l’IA en quelques étapes et sans connaissances en programmation, et l’utiliser sur une caméra en tant que système d’inférence embarqué. L’apprentissage profond devient ainsi convivial.

La vision par ordinateur et le traitement d’image sont devenus des outils indispensables dans différents domaines. De plus en plus, les systèmes de traitement d’image sont confrontés à une quantité toujours croissante de produits et de variantes, ainsi qu’à des objets organiques tels que fruits, légumes ou plantes. Les approches classiques, avec un traitement d’image basé sur des règles, atteignent rapidement leurs limites si les données graphiques à analyser varient trop fréquemment et que les différences sont difficiles ou impossibles à décrire avec des algorithmes. Dans ces cas-là, une automatisation robuste n’est pas réalisable au moyen d’un ensemble de règles inflexible. Même s’il s’agit d’une tâche qui, pour les personnes, est censée être facile à résoudre.

L’apprentissage machine permet désormais de transférer vers les systèmes de traitement d’image la capacité de prendre des décisions avec souplesse et autonomie. Grâce aux réseaux neuronaux et aux algorithmes d’apprentissage profond, nous pouvons apprendre à un ordinateur à voir des objets, à les reconnaître et à tirer des conclusions de ce qu’il a appris. Comme un être humain, une telle « automatisation intelligente « apprend et prend des décisions sur la base de valeurs empiriques.

Différences par rapport au traitement d’image classique

La façon dont les caractéristiques des images sont identifiées, par qui elles le sont et le mode de représentation des connaissances apprises, tels sont les principaux éléments de différenciation par rapport au traitement d’image basé sur des règles. Avec l’approche classique ou « symbolique », il appartient à un spécialiste du traitement d’image de sélectionner les caractéristiques des images qui sont décisives et de les décrire en fonction de certaines règles. De nombreuses lignes de code source sont requises pour spécifier en détail les modalités de résolution d’une tâche données. Car le logiciel peut reconnaître uniquement ce qui est couvert par les règles. L’exécution ultérieure a lieu dans des limites définies qui ne laissent pas de place à l’interprétation. Le véritable effort intellectuel concerne donc uniquement l’expert en traitement d’image.

La procédure est relativement différente pour un travail utilisant des réseaux neuronaux. Ces derniers présentent l’avantage de pouvoir apprendre de manière indépendante quelles caractéristiques des images sont importantes pour en tirer la conclusion correcte. On parle alors d’une « approche non symbolique », car les connaissances sont seulement implicites et il n’est pas possible d’expliquer comment et pourquoi l’intelligence artificielle réalise ces prédictions. Seuls la quantité et le contenu des images d’apprentissage influent sur le choix des caractéristiques enregistrées, sur leur pondération et sur les conclusions qui sont tirées. Les algorithmes d’apprentissage profond reconnaissent et analysent le contenu complet de l’image et établissent un lien entre caractéristiques identifiées et les « notions » à apprendre, en fonction de la fréquence des occurrences. La fréquence statistique produit pendant la formation ce que nous appelons une expérience. Spécialiste de l’intelligence artificielle chez Google, Cassie Kozyrkov, à l’occasion du Web Summit 2019 organisé à Lisbonne, a décrit l’apprentissage machine comme un outil pour la programmation. Il permet d’apprendre des choses à une machine par des exemples plutôt qu’à l’aide de nombreuses instructions.

Le développement des applications de vision machine basé sur l’intelligence artificiel doit donc être repensé. Il est important de comprendre que la qualité des résultats, c’est-à-dire la vitesse et la fiabilité de la détection des objets, dépend de ce qu’un réseau neuronal détecte et conclut. À cet égard, les connaissances de l’ouvrier spécialisé qui fournit les jeux de données nécessaires à la formation, avec le plus grand nombre possible d’exemples d’images différents accompagnant les notions à apprendre, jouent un rôle tout à fait décisif. La responsabilité qui, dans l’approche classique, était assumée par un spécialiste du traitement d’image, passe, dans l’apprentissage machine, entre les mains d’un spécialiste des données.

Un système de vision hybride embarqué

IDS a développé son propre cœur d’IA pour le FPGA de la plateforme de caméra IDS NXT intelligente, « deep ocean core », qui exécute des réseaux neuronaux préformés avec accélération matérielle. Les caméras industrielles complètes deviennent ainsi de puissantes caméras d’inférence qui rendent l’intelligence artificielle (IA) utilisable dans un environnement industriel. Les analyses sont décentralisées, ce qui permet d’éviter les congestions de bande passante lors du transfert. En termes de précision et de vitesse des tâches IA, les caméras IDS NXT peuvent suivre le rythme des UC d’ordinateur de bureau modernes, tout en exigeant nettement moins d’espace et d’énergie.

La parfaite coordination entre les logiciels et équipements propres d’IDS permet à l’utilisateur de choisir le temps d’inférence cible avant la formation. IDS NXT lighthouse optimise alors les paramètres de formation, en tenant compte des performances du cœur d’IA de la caméra. Aucune surprise n’attend par conséquent l’utilisateur lors de l’exécution ultérieure de l’inférence, ce qui évite les pertes de temps dues aux réajustements et au réapprentissage. Une fois intégré, le système IDS NXT reste compatible et cohérent à 100 % dans son comportement pour l’utilisateur. C’est un avantage significatif, en particulier pour les applications avec une certification industrielle.

Grâce à un matériel performant, la plateforme de vision embarquée est beaucoup plus qu’une simple caméra d’inférence servant à exécuter des réseaux neuronaux. Lors de la prochaine étape de développement, l’utilisateur pourra faire évoluer l’éventail de fonctions de la combinaison CPU-FPGA en fonction de ses besoins et grâce aux applications de vision. Les tâches de vision récurrentes peuvent alors être configurées et modifiées rapidement. Une séquence de traitement d’image entièrement flexible peut aussi être réalisée.

Pour en savoir plus : IDS IMAGING