En ce qui concerne les GPU, Nvidia est un expert de premier plan. Étant dans l'entreprise depuis 1993, NVIDIA a produit un large éventail de GPU professionnels et grand public de qualité supérieure. Les architectures estimées de leurs processeurs sont à l'origine du succès de leur produit, en particulier de leur ligne principale, le GeForce. Les GPU de Nvidia sont allés au-delà de l'espace de jeu, élargissant leur présence en Deep Learning, IA (intelligence artificielle) et accélération des analyses. Nvidia a infiltré le marché des centres de données il y a une décennie, à commencer par les puces Fermi. Des itérations ultérieures ont été faites et la société a continuellement publié des GPU qui répondent à la demande insatiable de vitesse de traitement plus rapide dans les centres de données. Les GPU de Nvidia ont évolué au fil des ans, et les conceptions d'architecture entraînent principalement l'évolution.
Architecture Ampère de Nvidia
La concurrence est très serrée parmi les fabricants de GPU, mais Nvidia ne retient rien pour prendre la première place. En fait, Nvidia a dominé le marché de l'IA au cours de la dernière décennie. En 2020, les nouvelles du premier GPU de Nvidia (8 nm pour les parties grand public) avec 54 milliards de transistors compressés dans un si petit dé. Nommé par code Ampère Après le mathématicien français André-Marie Ampère, L'architecture de processeur de Nvidia augmente une amélioration massive par rapport à ses prédécesseurs, Turing et Volta, promettant plus de fonctionnalités, une meilleure efficacité et des performances plus élevées à des niveaux de puissance plus bas. Ampère est derrière la deuxième génération de GPU RTX de Nvidia, la série RTX 30, et serait deux fois plus rapide que leurs homologues de la série RTX 20. L'architecture Ampère est également la force derrière les GPU du NVIDIA A100 Data Center.
Les spécifications d'Ampère
Ampère est le premier GPU de 7 nm / 8 nm de Nvidia, la deuxième génération de traçage des rayons de consommation, et a la troisième génération de noyaux de tenseur. Ampère est l'architecture sous-jacente des GPU GA100, GA102 et GA104 qui sont intégrés dans GeForce RTX 3090, RTX 3080, RTX 3070 et, plus récemment, le RTX 3060. Nvidia devrait également publier RTX 3050 dans les mois suivants. Pendant ce temps, le GPU Enterprise GA100 fournit 20 fois plus de puissance de calcul que les générations précédentes de GPU du centre de données. Voici un aperçu des GPU professionnels et grand public basés sur AMPERE de NVIDIA [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Carte graphique | Nvidia a100 | Geforce rtx 3090 | Geforce rtx 3080 | Geforce rtx 3070 |
Processus (nm) | TSMC N7 | Samsung 8n | Samsung 8n | Samsung 8n |
Transistors (milliards) | 54 | 28.3 | 28.3 | 17.4 |
Taille de matrice (mm ^ 2) | 826 | 628.4 | 628.4 | 392.5 |
Configuration GPC | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
SMS | 108 | 82 | 68 | 46 |
Cœurs cuda | 6912 | 10496 | 8704 | 5888 |
Cœurs RT | Aucun | 82 | 68 | 46 |
Noyaux de tenseur | 432 | 328 | 272 | 184 |
Boost Clock (MHz) | 1410 | 1700 | 1710 | 1730 |
VRAM Speed (GBPS) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
Vram (gb) | 40 (48 max) | 24 | dix | 8 |
Largeur de bus | 5120 (6144 max) | 384 | 320 | 256 |
Rops | 128 | 112 | 96 | 96 |
TMUS | 864 | 656 | 544 | 368 |
Gflops fp32 | 19492 | 35686 | 29768 | 20372 |
Rt tflops | N / A | 69 | 58 | 40 |
Tensor Tflops FP16 (Sparsity) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Bande passante (GB / s) | 1555 | 936 | 760 | 448 |
TBP (Watts) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia a100
Le NVIDIA A100 est le premier GPU qui a utilisé l'architecture Ampère. La puce d'entreprise est ciblée sur les centres de données et conçu pour les tâches à forte intensité de GPU telles que le deep Learning et l'IA. Construit en utilisant le processus 7 nm de TSMC, il abrite un montant énorme de 54 milliards de transistors. Il a surpassé les générations précédentes de GPU d'entreprise avec une augmentation de 20x des performances comportant 6 912 cœurs CUDA, 432 unités de cartographie de texture, 160 ROPS, des noyaux de tenseur de troisième génération et un VRAM de 40 Go avec bande passante de mémoire qui est en tête à 1.6 To / sec. DGX A100 est le premier système d'IA au monde avec un groupe de huit A100 et un prix élevé de 199 000 $.
Série GeForce RTX 30
En plus de dominer le marché des entreprises, Nvidia a toujours à l'esprit les consommateurs, en particulier les joueurs et les créateurs,. L'architecture Ampère est également adoptée dans les cartes graphiques de consommation de Nvidia. La deuxième génération de GeForce RTX transporte les GPU basés sur Ampère augmentant les performances à deux fois plus que la génération précédente.
Dans la plupart des aspects, Ampère a plus du double de la puissance de traitement de Turing. Il a doublé les performances du shader de Turing avec deux fois le nombre de cœurs CUDA FP32. Plus précisément, il a 30 shader-tflops, 2.7x plus que Turing's qui n'est que 11 shader-tflops. De même, le cœur du tenseur de Turing mesures à 89 Tensor-tflops, mais Ampère a plus que doublé ce taux avec ses 238 tensor-tflops. Sans oublier ses taux de noyau de tracé de rayons, qui est de 58 RT-Tflops, 1.7x plus vite que les 34 RT-Tflops de Turing, et pour rendre les GPU encore plus rapidement, la puce Ampère se connecte à la mémoire la plus rapide du monde, le Micron G6X.
La série RTX 30 est fabriquée à l'aide d'un processus personnalisé Samsung 8N Nvidia avec 28 milliards de transistors pour GA102 et 17 milliards de transistors pour GA104. La classe Titan RTX 3090 est alimentée par le GPU GA102 et offre des performances de carte de consommation extrêmement puissantes. Contrairement aux générations précédentes, RTX 3090 est ouvert à des tiers pour une conception personnalisée.
RTX 3080 utilise également un GPU GA102, offrant deux fois les performances de RTX 2080 et une impressionnante prouesse de jeu 4K. RTX 3070, alimenté par GA104 GPU, est à égalité avec RTX 2080 TI à la moitié du prix. Le RTX 3060 récemment publié ne manque jamais non plus d'impressionner avec ses performances stupéfiantes entraînées par des noyaux de traçage de rayons améliorés, des noyaux de tenseur, de nouveaux multiprocesseurs en streaming et une mémoire G6 à grande vitesse.
Malgré l'augmentation massive des performances, les nouveaux GPU RTX ne se lancent pas sur la poche. Les cartes graphiques beaucoup plus rapides sont facilement accessibles en matière de prix. Le produit phare de Nvidia Geforce, RTX 3080, commence à 699 $, le RTX 3070 se vend à 499 $ et le RTX 3060 a un prix de 329 $. Le RTX 3090 haut de gamme coûte 1 499 $; Toujours considérablement à faible coût compte tenu de ses performances au niveau du titan.
Quelques mois seulement après sa sortie, il y aurait eu une pénurie de cartes graphiques basées sur Ampère, et ce n'est pas une surprise avec les performances étonnantes d'Ampère à un prix raisonnable. Pour ceux qui envisagent une mise à niveau du GPU, c'est le meilleur moment pour mettre la main sur les GPU basés sur Ampère de Nvidia.
Sources
[1] Walton, Jarred. «NVIDIA RTX 30-Série Ampère Architecture Deep Dive: Tout ce que nous savons». https: // www.Tomshardware.com / fonctionnalités / nvidia-ampère-architecture-profonde. 13 octobre 2020.