Fonction de nombre de décalage vers le rouge

Fonction de nombre de décalage vers le rouge
La fonction de décompte de Redshift est l'une des fonctions agrégées dans Amazon Redshift. Il compte le nombre d'entrées (lignes) d'une déclaration et renvoie le décompte en réponse. La fonction Count obtient la réponse d'une requête puis renvoie le nombre de lignes dans les expressions sélectionnées. La fonction de nombre est indépendante des types de données de l'expression d'entrée et peut être utilisé avec tous les types de données.

La fonction de nombre compte le nombre de lignes (entrées) d'une instruction sélectionnée transmise à la fonction comme une expression d'entrée. Il serait beaucoup plus difficile de compter le nombre de lignes s'ils sont des centaines ou des milliers.

Dans ce blog, nous discuterons de la façon dont la fonction de nombre dans Redshift peut être utilisée dans différents scénarios pour compter le nombre de lignes.

Syntaxe de la fonction de comptage

La syntaxe pour utiliser la fonction de nombre de décalage vers le rouge est la suivante.

Compter ([distinct | tout] * | expression)

Ici, nous discuterons des différents paramètres qui peuvent être transmis à la fonction de comptage tout en comptant le nombre de lignes.

Distinct | TOUS

Le DISTINCT Le paramètre est utilisé lorsque vous n'avez besoin que du nombre de lignes distinctes et supprimez le nombre en double de lignes pendant le comptage. Le TOUS Le paramètre est utilisé lorsque vous devez compter toutes les lignes, y compris les duplications.

Expression

Ce paramètre est la colonne ciblée dans le tableau pour lequel vous souhaitez utiliser la fonction de nombre. La fonction Count obtiendra l'entrée de l'expression et renvoie le nombre de lignes. Afin de compter toutes les lignes d'une colonne dans la table Redshift, vous pouvez utiliser l'expression (*).

Exemples de la fonction de comptage

Dans cette section, nous verrons comment nous pouvons appliquer la fonction de nombre dans différents scénarios. Nous pouvons utiliser la fonction de nombre de plusieurs manières pour obtenir le nombre de lignes. Certains des cas d'utilisation de la fonction de comptage sont répertoriés ci-dessous:

  • Comptez la fonction sur les lignes non nuls
  • Compter les lignes nulles de fonction
  • Comptez la fonction sur les lignes multi-nuls
  • Compter la fonction à l'aide de (*) paramètre
  • Compter la fonction en utilisant un paramètre distinct
  • Comptez la fonction sur les lignes nulles en utilisant un paramètre distinct

Comptez la fonction sur les lignes non nuls

Maintenant, nous utiliserons la fonction de nombre sur un tableau où les lignes ont certaines valeurs (pas nul). Laissez-nous une table (Redshift_count_function) avec trois colonnes (Id, first_name et nom de famille), comme indiqué ci-dessous. Maintenant, nous appliquerons la fonction de nombre sur le tableau suivant pour obtenir le nombre de lignes:

IDENTIFIANT prénom nom de famille
00 Dwayne Johnson
11 Vin Diesel
22 Sera Forgeron
33 Robert Downey Jr.
44 Chris Hemsworth

Appliquer la fonction de décompte sur le IDENTIFIANT colonne du Redshift_count_function tableau.

Sélectionnez Count (ID)
De redshift_count_function;

La sortie de la requête précédente sera la suivante lors de l'exécution:

compter
5

Comptez la fonction sur les lignes nuls

La fonction de nombre peut également être appliquée pour compter le nombre d'entrées (lignes) renvoyées par une expression. Si l'une des entrées renvoyées par l'expression est nul, la fonction de comptage ne comptera pas et ne l'exclura pas du résultat. Dans cet exemple, nous appliquerons la fonction de décompte sur la colonne ayant au moins une valeur nul.

S_no prénom nom de famille
1 Dwayne Johnson
2 Vin Diesel
3 Sera Forgeron
4 Robert Downey Jr.
5 Chris NUL
6 Leonardo Dicaprio

Appliquer la fonction de décompte sur le nom de famille colonne du Redshift_count_function tableau. Une ligne a une valeur nulle, donc la fonction de nombre ne compte pas cette ligne.

Sélectionnez Count (Last_name)
De redshift_count_function;

La sortie de la requête précédente sera la suivante lors de l'exécution:

compter
5

La sortie montre que la fonction de nombre ne compte que les lignes ayant certaines valeurs et rejette la ligne nul.

Comptez la fonction sur les lignes multiples

Maintenant, nous avons une table dans laquelle une colonne prénom Comprend plusieurs valeurs nulles. Ici, nous appliquerons la fonction de décompte sur le prénom colonne du Redshift_count_function table pour obtenir le nombre de lignes qui n'ont pas de valeur nulle.

S_no prénom nom de famille
1 Dwayne Johnson
2 NUL Diesel
3 Sera Forgeron
4 NUL Downey Jr.
5 Chris NUL
6 NUL Dicaprio

Appliquer la fonction de décompte sur le prénom colonne du Redshift_count_function table en utilisant la requête suivante. Trois lignes ont une valeur nulle, donc la fonction de comptage ne compte pas ces lignes.

Sélectionnez Count (First_name)
De redshift_count_function;

La sortie de la requête précédente sera la suivante lors de l'exécution:

compter
3

Compter la fonction à l'aide de (*) paramètre

Dans cet exemple, nous appliquerons la fonction de nombre à l'aide du paramètre (*). Ce paramètre est utilisé lorsque vous devez compter toutes les lignes, même si les lignes contiennent des valeurs nulles.

S_no prénom nom de famille
1 Dwayne Johnson
2 Vin Diesel
3 Sera Forgeron
4 Robert Downey Jr.
5 Chris NUL
6 Leonardo Dicaprio

Appliquer la fonction de décompte sur le redshift_count_functioN Tableau en exécutant la requête suivante:

Sélectionnez Count (*)
De redshift_count_function;

La sortie de la requête précédente sera la suivante lors de l'exécution:

compter
6

Cet exemple montre que le paramètre (*) compte toutes les lignes même si une ligne contient des valeurs nulles.

Compter la fonction en utilisant un paramètre distinct

Dans cet exemple, nous utiliserons la fonction de nombre en appliquant le paramètre distinct. Ce paramètre ne compte qu'un nombre distinct de lignes et laisse des lignes en double.

S_no IDENTIFIANT prénom nom de famille
1 11 Dwayne Johnson
2 22 Vin Diesel
3 33 Sera Forgeron
4 44 Robert Downey Jr.
5 55 Chris Hemsworth
6 66 Leonardo Dicaprio
7 77 Dwayne Johnson
8 88 Vin Diesel
9 99 Sera Forgeron
dix 1010 Robert Downey Jr.
11 1111 Chris Hemsworth
12 1212 Leonardo Dicaprio

Appliquer la fonction de comptage en utilisant le paramètre distinct sur le nom de famille colonne de la table ci-dessus. Il n'y a que six lignes distinctes, donc la fonction de nombre ne comptera que les lignes distinctes.

Sélectionnez Count (Last_name distinct)
De redshift_count_function;

La sortie de la requête précédente sera la suivante lors de l'exécution:

compter
6

Comptez la fonction sur les lignes nulles en utilisant un paramètre distinct

Dans cet exemple, nous utiliserons la fonction de nombre sur la colonne ayant une ligne nul à l'aide d'un paramètre distinct.

S_no IDENTIFIANT prénom nom de famille
1 11 Dwayne Johnson
2 22 Vin Diesel
3 33 Sera Forgeron
4 44 Robert Downey Jr.
5 55 Chris NUL
6 66 Sera Forgeron

Appliquer la fonction de comptage en utilisant le paramètre distinct sur le nom de famille colonne de ce tableau. Cela ne comptera que quatre lignes car une ligne a un null, et une ligne a une valeur en double.

Sélectionnez Count (Last_name distinct)
De redshift_count_function;

La sortie de la requête précédente sera la suivante lors de l'exécution:

compter
4

Conclusion

Dans cet article, nous avons étudié comment utiliser la fonction de nombre pour compter le nombre de lignes renvoyées par une expression. La fonction de nombre peut être appliquée pour compter le nombre total de lignes et les lignes uniques qu'en spécifiant le paramètre distinct. Afin de compter toutes les lignes, y compris les valeurs nulles, utilisez la fonction de nombre avec le paramètre (*).