Qu'est-ce que nvidia ampère?

Qu'est-ce que nvidia ampère?

En ce qui concerne les GPU, Nvidia est un expert de premier plan. Étant dans l'entreprise depuis 1993, NVIDIA a produit un large éventail de GPU professionnels et grand public de qualité supérieure. Les architectures estimées de leurs processeurs sont à l'origine du succès de leur produit, en particulier de leur ligne principale, le GeForce. Les GPU de Nvidia sont allés au-delà de l'espace de jeu, élargissant leur présence en Deep Learning, IA (intelligence artificielle) et accélération des analyses. Nvidia a infiltré le marché des centres de données il y a une décennie, à commencer par les puces Fermi. Des itérations ultérieures ont été faites et la société a continuellement publié des GPU qui répondent à la demande insatiable de vitesse de traitement plus rapide dans les centres de données. Les GPU de Nvidia ont évolué au fil des ans, et les conceptions d'architecture entraînent principalement l'évolution.

Architecture Ampère de Nvidia

La concurrence est très serrée parmi les fabricants de GPU, mais Nvidia ne retient rien pour prendre la première place. En fait, Nvidia a dominé le marché de l'IA au cours de la dernière décennie. En 2020, les nouvelles du premier GPU de Nvidia (8 nm pour les parties grand public) avec 54 milliards de transistors compressés dans un si petit dé. Nommé par code Ampère Après le mathématicien français André-Marie Ampère, L'architecture de processeur de Nvidia augmente une amélioration massive par rapport à ses prédécesseurs, Turing et Volta, promettant plus de fonctionnalités, une meilleure efficacité et des performances plus élevées à des niveaux de puissance plus bas. Ampère est derrière la deuxième génération de GPU RTX de Nvidia, la série RTX 30, et serait deux fois plus rapide que leurs homologues de la série RTX 20. L'architecture Ampère est également la force derrière les GPU du NVIDIA A100 Data Center.

Les spécifications d'Ampère

Ampère est le premier GPU de 7 nm / 8 nm de Nvidia, la deuxième génération de traçage des rayons de consommation, et a la troisième génération de noyaux de tenseur. Ampère est l'architecture sous-jacente des GPU GA100, GA102 et GA104 qui sont intégrés dans GeForce RTX 3090, RTX 3080, RTX 3070 et, plus récemment, le RTX 3060. Nvidia devrait également publier RTX 3050 dans les mois suivants. Pendant ce temps, le GPU Enterprise GA100 fournit 20 fois plus de puissance de calcul que les générations précédentes de GPU du centre de données. Voici un aperçu des GPU professionnels et grand public basés sur AMPERE de NVIDIA [1]:

GPU GA100 GA102 GA102 GA104
Carte graphique Nvidia a100 Geforce rtx 3090 Geforce rtx 3080 Geforce rtx 3070
Processus (nm) TSMC N7 Samsung 8n Samsung 8n Samsung 8n
Transistors (milliards) 54 28.3 28.3 17.4
Taille de matrice (mm ^ 2) 826 628.4 628.4 392.5
Configuration GPC 8 × 16 7 × 12 6 × 12 6 × 8
SMS 108 82 68 46
Cœurs cuda 6912 10496 8704 5888
Cœurs RT Aucun 82 68 46
Noyaux de tenseur 432 328 272 184
Boost Clock (MHz) 1410 1700 1710 1730
VRAM Speed ​​(GBPS) 2.43 19.5 (GDDR6X) 19 (GDDR6X) 14 (GDDR6)
Vram (gb) 40 (48 max) 24 dix 8
Largeur de bus 5120 (6144 max) 384 320 256
Rops 128 112 96 96
TMUS 864 656 544 368
Gflops fp32 19492 35686 29768 20372
Rt tflops N / A 69 58 40
Tensor Tflops FP16 (Sparsity) 312 (628) 143 (285) 119 (238) 81 (163)
Bande passante (GB / s) 1555 936 760 448
TBP (Watts) 400 (250 PCIe) 350 320 220

Nvidia a100

Le NVIDIA A100 est le premier GPU qui a utilisé l'architecture Ampère. La puce d'entreprise est ciblée sur les centres de données et conçu pour les tâches à forte intensité de GPU telles que le deep Learning et l'IA. Construit en utilisant le processus 7 nm de TSMC, il abrite un montant énorme de 54 milliards de transistors. Il a surpassé les générations précédentes de GPU d'entreprise avec une augmentation de 20x des performances comportant 6 912 cœurs CUDA, 432 unités de cartographie de texture, 160 ROPS, des noyaux de tenseur de troisième génération et un VRAM de 40 Go avec bande passante de mémoire qui est en tête à 1.6 To / sec. DGX A100 est le premier système d'IA au monde avec un groupe de huit A100 et un prix élevé de 199 000 $.

Série GeForce RTX 30

En plus de dominer le marché des entreprises, Nvidia a toujours à l'esprit les consommateurs, en particulier les joueurs et les créateurs,. L'architecture Ampère est également adoptée dans les cartes graphiques de consommation de Nvidia. La deuxième génération de GeForce RTX transporte les GPU basés sur Ampère augmentant les performances à deux fois plus que la génération précédente.

Dans la plupart des aspects, Ampère a plus du double de la puissance de traitement de Turing. Il a doublé les performances du shader de Turing avec deux fois le nombre de cœurs CUDA FP32. Plus précisément, il a 30 shader-tflops, 2.7x plus que Turing's qui n'est que 11 shader-tflops. De même, le cœur du tenseur de Turing mesures à 89 Tensor-tflops, mais Ampère a plus que doublé ce taux avec ses 238 tensor-tflops. Sans oublier ses taux de noyau de tracé de rayons, qui est de 58 RT-Tflops, 1.7x plus vite que les 34 RT-Tflops de Turing, et pour rendre les GPU encore plus rapidement, la puce Ampère se connecte à la mémoire la plus rapide du monde, le Micron G6X.

La série RTX 30 est fabriquée à l'aide d'un processus personnalisé Samsung 8N Nvidia avec 28 milliards de transistors pour GA102 et 17 milliards de transistors pour GA104. La classe Titan RTX 3090 est alimentée par le GPU GA102 et offre des performances de carte de consommation extrêmement puissantes. Contrairement aux générations précédentes, RTX 3090 est ouvert à des tiers pour une conception personnalisée.

RTX 3080 utilise également un GPU GA102, offrant deux fois les performances de RTX 2080 et une impressionnante prouesse de jeu 4K. RTX 3070, alimenté par GA104 GPU, est à égalité avec RTX 2080 TI à la moitié du prix. Le RTX 3060 récemment publié ne manque jamais non plus d'impressionner avec ses performances stupéfiantes entraînées par des noyaux de traçage de rayons améliorés, des noyaux de tenseur, de nouveaux multiprocesseurs en streaming et une mémoire G6 à grande vitesse.

Malgré l'augmentation massive des performances, les nouveaux GPU RTX ne se lancent pas sur la poche. Les cartes graphiques beaucoup plus rapides sont facilement accessibles en matière de prix. Le produit phare de Nvidia Geforce, RTX 3080, commence à 699 $, le RTX 3070 se vend à 499 $ et le RTX 3060 a un prix de 329 $. Le RTX 3090 haut de gamme coûte 1 499 $; Toujours considérablement à faible coût compte tenu de ses performances au niveau du titan.

Quelques mois seulement après sa sortie, il y aurait eu une pénurie de cartes graphiques basées sur Ampère, et ce n'est pas une surprise avec les performances étonnantes d'Ampère à un prix raisonnable. Pour ceux qui envisagent une mise à niveau du GPU, c'est le meilleur moment pour mettre la main sur les GPU basés sur Ampère de Nvidia.

Sources

[1] Walton, Jarred. «NVIDIA RTX 30-Série Ampère Architecture Deep Dive: Tout ce que nous savons». https: // www.Tomshardware.com / fonctionnalités / nvidia-ampère-architecture-profonde. 13 octobre 2020.