Réseaux diffractifs codés par impulsion orbitale-angulaire pour les tâches de classification d’objets

L’apprentissage profond a révolutionné la façon dont nous percevons et utilisons les données. Cependant, à mesure que les ensembles de données augmentent et que les exigences informatiques augmentent, nous avons besoin de moyens plus efficaces pour gérer, stocker et traiter les données. À cet égard, l’informatique optique est considérée comme la prochaine frontière de la technologie informatique. Plutôt que d’utiliser des signaux électroniques, l’informatique optique s’appuie sur les propriétés des ondes lumineuses, telles que la longueur d’onde et la polarisation, pour stocker et traiter les données.

Les réseaux neuronaux profonds diffractifs (D2NN) utilisent diverses propriétés des ondes lumineuses pour effectuer des tâches telles que la reconnaissance d’images et d’objets. De tels réseaux sont constitués de réseaux de pixels bidimensionnels servant de couches diffractives. Chaque pixel sert de paramètre réglable qui affecte les propriétés des ondes lumineuses qui le traversent. Cette conception unique permet aux réseaux d’effectuer des tâches informatiques en manipulant les informations contenues dans les ondes lumineuses. Jusqu’à présent, les D2NN exploitaient les propriétés des ondes lumineuses telles que l’intensité, la phase, la polarisation et la longueur d’onde.

Maintenant, dans une étude Publié dans Nexus photonique avancé, des chercheurs de l’Université Minzu de Chine, de l’Université de Pékin et de l’Université du Shanxi en Chine ont développé trois D2NN avec des couches diffractives capables de reconnaître des objets en utilisant les informations contenues dans le moment angulaire orbital (OAM) de la lumière. Il s’agit notamment des D2NN codés OAM à détecteur unique pour la classification monotâche et multitâche, et des D2NN codés OAM multidétecteur pour la classification multitâche répétable.

Mais qu’est-ce que l’OAM ? C’est une propriété des ondes lumineuses liée à son mouvement de rotation ou de torsion. Elle peut prendre une infinité de valeurs indépendantes, chacune correspondant à un mode de lumière différent. En raison de son large éventail d’états ou de modes possibles, l’OAM peut transporter des informations spatiales telles que la position, la disposition ou la structure d’un objet. Dans le cadre D2NN proposé, les faisceaux OAM contenant des informations éclairant les chiffres manuscrits sont combinés en un seul faisceau vortex. Ce faisceau, contenant plusieurs modes OAM, chacun associé à une torsion ou rotation spécifique des ondes lumineuses, traverse cinq couches diffractives entraînées à reconnaître les caractéristiques des chiffres manuscrits des modes OAM.

Une caractéristique notable du D2NN codé en OAM est sa capacité à discerner la séquence de chiffres répétitifs. Pour y parvenir, les chercheurs ont utilisé plusieurs détecteurs pour traiter simultanément les informations OAM de plusieurs images.

Lorsqu’il a été testé sur l’ensemble de données MNIST, un ensemble de données couramment utilisé pour la reconnaissance de chiffres manuscrits, le D2NN a correctement prédit les chiffres uniques dans les images environ 85,49 % du temps, un niveau de précision comparable aux modèles D2NN qui exploitent les propriétés de longueur d’onde et de polarisation de la lumière.

L’utilisation des modes OAM pour coder les informations constitue une étape importante vers l’avancement des capacités de traitement parallèle et bénéficiera aux applications nécessitant un traitement en temps réel, telles que la reconnaissance d’images ou les tâches gourmandes en données.

En effet, ce travail réalise une percée dans la classification parallèle en utilisant le degré de liberté OAM, surpassant ainsi les autres conceptions D2NN existantes. Notamment, les D2NN codés en OAM fournissent un cadre puissant pour améliorer encore la capacité de classification parallèle tout optique et les tâches de vision industrielle basées sur l’OAM et devraient ouvrir des directions de recherche prometteuses pour le D2NN.

Plus d’information:
Kuo Zhang et al, Classification entièrement optique avancée utilisant des réseaux diffractifs codés par impulsion orbitale-angulaire, Nexus photonique avancé (2023). DOI : 10.1117/1.APN.2.6.066006

ph-tech