La nouvelle structure matérielle offre un avantage dans l’informatique IA

Les résultats de la recherche ont démontré que l’informatique de réservoir peut être mise en œuvre avec des transistors à grille ferroélectrique (FeFET) sous une forme d’informatique en mémoire. Crédit : Shinichi Takagi, Université de Tokyo

À mesure que les applications d’intelligence artificielle se répandent, davantage de calculs doivent avoir lieu – et plus efficacement avec moins de consommation d’énergie – sur des appareils locaux, plutôt que sur des centres de données géographiquement éloignés, afin de surmonter les retards frustrants dans les réponses. Un groupe d’ingénieurs de l’Université de Tokyo a pour la première fois testé l’utilisation de matériaux ferroélectriques à base d’oxyde d’hafnium pour le calcul physique des réservoirs – un type de réseau de neurones qui cartographie les données sur des systèmes physiques et peut précisément réaliser cette avancée – dans une application de reconnaissance. de la parole.

Ils ont décrit leurs résultats dans un article présenté au Symposium Hybrid 2022 IEEE sur la technologie et les circuits VLSI, qui s’est tenu à Honolulu, Hawaï, du 12 au 17 juin.

Le développement de la technologie de l’intelligence artificielle (IA) et de ses innombrables applications a explosé ces dernières années, mais un obstacle majeur à son déploiement futur provient du coût colossal du calcul et de la consommation d’énergie, en particulier lorsque ce calcul est effectué par des logiciels dont l’emplacement physique est dans des centres de données à une distance considérable de l’utilisateur.

Même avec des données circulant sur les réseaux à la vitesse de la lumière, il peut y avoir des retards de quelques fractions de seconde ou plus entre la demande d’un utilisateur et la livraison de la réponse d’une application. Cela est dû aux grandes distances parcourues par les photons de l’utilisateur au centre de données – parfois à un demi-monde – puis retour. Pour les applications grand public, des jeux vidéo aux assistants vocaux, ce petit retard peut être frustrant, mais pour les applications critiques du gouvernement, de la santé à la défense, ces retards – connus sous le nom de latence – peuvent coûter des vies.

La nouvelle architecture matérielle offre un avantage dans l'informatique IA

Cette machine est utilisée pour déposer une couche mince de matériaux ferroélectriques à base d’oxyde d’hafnium afin de produire des transistors ferroélectriques (FeFET) utilisés dans une nouvelle architecture informatique de réservoir physique développée par des chercheurs de l’Université de Tokyo. Crédit : Kasidit Toprasertpong, Université de Tokyo

Les informaticiens et ingénieurs se concentrent sur deux lignes d’attaque pour surmonter ce défi : déplacer au moins une partie de l’informatique nécessaire du logiciel au matériel et des centres de données centralisés, ou cloud, vers un appareil sur site.

La première stratégie est nécessaire car il n’est pas logique d’essayer simplement d’obtenir des gains d’efficacité sur les programmes en cours d’exécution et pas également sur les machines sur lesquelles ils s’exécutent. La deuxième stratégie, connue sous le nom d’edge computing, réduit la latence car il y a simplement moins de distance à parcourir pour les données. Lorsque votre smartphone effectue les calculs impliqués dans une analyse biométrique (et non le centre de données à une certaine distance), il s’agit d’un exemple de dispersion du calcul de l’informatique de pointe du cloud vers l’appareil.

Dernièrement, l’informatique de réservoir physique (PRC) – dans laquelle des gains d’efficacité sont obtenus sur le matériel de l’appareil local – a attiré beaucoup d’attention de la part des chercheurs en ingénierie pour sa capacité à faire progresser ces deux lignes d’attaque. Le PRC est une conséquence du développement des réseaux de neurones récurrents (RNN), un type d’apprentissage automatique adapté au traitement des données dans le temps (données temporelles) plutôt que des données statiques. En effet, les RNN prennent en compte les informations des entrées précédentes pour considérer une entrée actuelle (donc “récurrente”) et, à partir de là, la sortie. En raison de cette capacité à gérer des données temporelles, les RNN conviennent aux applications dont les conclusions (ou inférences) sont sensibles à la séquence de données ou au contexte temporel, telles que la reconnaissance vocale, le traitement du langage naturel ou la traduction de la langue, et utilisées par des applications comme Google. Traduire ou Siri.

Dans l’informatique de réservoir physique, les données d’entrée sont mappées à des modèles dans un système physique ou un réservoir (tels que des modèles dans la structure d’un matériau magnétique, d’un système de photons ou d’un dispositif mécanique), qui bénéficie d’un espace dimensionnel plus élevé que l’autre. l’entrée. (Un morceau de papier est un espace qui a une dimension supérieure à un morceau de ficelle, et une boîte est encore une dimension de plus que le morceau de papier.) Ensuite, une analyse de modèle est effectuée sur les modèles spatio-temporels dans la lecture finale “couche” pour comprendre l’état du réservoir. Comme l’IA n’est pas entraînée sur les connexions récurrentes au sein du réservoir, mais uniquement sur la lecture, des algorithmes d’apprentissage plus simples sont réalisables, réduisant considérablement le calcul requis, permettant un apprentissage à grande vitesse et réduisant la consommation d’énergie.

La nouvelle architecture matérielle offre un avantage dans l'informatique IA

Le système est utilisé pour mesurer les performances d’une nouvelle architecture matérielle utilisant des ferroélectriques d’oxyde d’hafnium pour le concept émergent de calcul de réservoir physique. Crédit : Kasidit Toprasertpong, Université de Tokyo

Des ingénieurs de l’Université de Tokyo avaient déjà développé une nouvelle architecture PRC qui utilise des transistors ferroélectriques (FeFET) constitués de matériaux ferroélectriques à base d’oxyde d’hafnium. La plupart des gens connaissent le ferromagnétisme, dans lequel un aimant en fer est magnétisé en permanence dans une certaine direction polaire (une partie de l’aimant devient son “nord” et l’autre extrémité son “sud”). La ferroélectricité implique un phénomène analogue dans lequel certains matériaux – dans ce cas, l’oxyde d’hafnium et l’oxyde de zirconium – subissent une polarisation électrique (un déplacement de charge électrique positive et négative) qui peut ensuite être inversée par l’application d’un champ électrique externe. Cette polarisation commutable peut ainsi stocker de la mémoire comme n’importe quel transistor. En 2020, les chercheurs ont également démontré qu’une opération informatique de base sur les réservoirs était possible avec ces matériaux.

“Ces matériaux sont déjà couramment utilisés dans les processus de fabrication de circuits intégrés à semi-conducteurs”, a déclaré Shinichi Takagi, co-auteur de l’article et professeur au Département de génie électrique et des systèmes d’information de l’Université de Tokyo. “Cela signifie que les réservoirs FeFET devraient être intégrés dans la fabrication de circuits intégrés semi-conducteurs à grande échelle avec peu de difficulté par rapport à certains matériaux plus récents.”

Bien que les matériaux ferroélectriques à base d’oxyde d’hafnium aient fait l’objet de beaucoup d’attention dans l’industrie des semi-conducteurs en raison de leur ferroélectricité, il fallait encore étudier à quel type d’applications l’informatique de réservoir physique à base de FeFET était adaptée et dans quelle mesure elle fonctionnait dans des applications réelles.

Après avoir prouvé la viabilité de leur architecture PRC il y a deux ans, les chercheurs l’ont ensuite testée dans une application de reconnaissance vocale. Ils ont trouvé qu’il était précis à 95,9 % pour la reconnaissance vocale des nombres de zéro à neuf. Cela a prouvé pour la première fois la facilité d’utilisation de la technologie dans une application réelle.

La nouvelle architecture matérielle offre un avantage dans l'informatique IA

Les modèles de transistors à grille ferroélectrique (FeFET) présentés ici sont utilisés dans une nouvelle architecture informatique de réservoir physique développée par une équipe de chercheurs de l’Université de Tokyo. Crédit : Kasidit Toprasertpong, Université de Tokyo

Les chercheurs veulent maintenant voir s’ils peuvent augmenter les performances de calcul de leurs réservoirs FeFET, ainsi que les tester dans d’autres applications.

À terme, les chercheurs espèrent démontrer qu’une puce d’IA dotée d’une architecture PRC ferroélectrique à base d’oxyde d’hafnium peut atteindre un haut niveau de performances en termes de consommation d’énergie extrêmement faible et de traitement en temps réel par rapport aux méthodes conventionnelles et au matériel de calcul d’IA.


Construire une nouvelle mémoire de stockage de données


Plus d’information:
E. Nako, K. Toprasertpong, R. Nakane, M. Takenaka et S. Takagi, “Experimental Demonstration of the Novel Scheme of HZO/Si FeFET Reservoir Computing with Parallel Data Processing for Speech Recognition,” 2022 IEEE Symposium on VLSI Technology & Circuits : 12 au 17 juin 2022.

Conférence : www.vlsisymposium.org/

Fourni par l’Université de Tokyo

Devis: Une nouvelle architecture matérielle fournit une longueur d’avance sur l’informatique IA (13 juin 2022) récupéré le 13 juin 2022 sur https://techxplore.com/news/2022-06-hardware-architecture-edge-ai.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre informatif uniquement.

Leave a Comment