La fonction de nombre compte le nombre de lignes (entrées) d'une instruction sélectionnée transmise à la fonction comme une expression d'entrée. Il serait beaucoup plus difficile de compter le nombre de lignes s'ils sont des centaines ou des milliers.
Dans ce blog, nous discuterons de la façon dont la fonction de nombre dans Redshift peut être utilisée dans différents scénarios pour compter le nombre de lignes.
Syntaxe de la fonction de comptage
La syntaxe pour utiliser la fonction de nombre de décalage vers le rouge est la suivante.
Compter ([distinct | tout] * | expression)
Ici, nous discuterons des différents paramètres qui peuvent être transmis à la fonction de comptage tout en comptant le nombre de lignes.
Distinct | TOUS
Le DISTINCT Le paramètre est utilisé lorsque vous n'avez besoin que du nombre de lignes distinctes et supprimez le nombre en double de lignes pendant le comptage. Le TOUS Le paramètre est utilisé lorsque vous devez compter toutes les lignes, y compris les duplications.
Expression
Ce paramètre est la colonne ciblée dans le tableau pour lequel vous souhaitez utiliser la fonction de nombre. La fonction Count obtiendra l'entrée de l'expression et renvoie le nombre de lignes. Afin de compter toutes les lignes d'une colonne dans la table Redshift, vous pouvez utiliser l'expression (*).
Exemples de la fonction de comptage
Dans cette section, nous verrons comment nous pouvons appliquer la fonction de nombre dans différents scénarios. Nous pouvons utiliser la fonction de nombre de plusieurs manières pour obtenir le nombre de lignes. Certains des cas d'utilisation de la fonction de comptage sont répertoriés ci-dessous:
Comptez la fonction sur les lignes non nuls
Maintenant, nous utiliserons la fonction de nombre sur un tableau où les lignes ont certaines valeurs (pas nul). Laissez-nous une table (Redshift_count_function) avec trois colonnes (Id, first_name et nom de famille), comme indiqué ci-dessous. Maintenant, nous appliquerons la fonction de nombre sur le tableau suivant pour obtenir le nombre de lignes:
IDENTIFIANT | prénom | nom de famille |
---|---|---|
00 | Dwayne | Johnson |
11 | Vin | Diesel |
22 | Sera | Forgeron |
33 | Robert | Downey Jr. |
44 | Chris | Hemsworth |
Appliquer la fonction de décompte sur le IDENTIFIANT colonne du Redshift_count_function tableau.
Sélectionnez Count (ID)
De redshift_count_function;
La sortie de la requête précédente sera la suivante lors de l'exécution:
compter
5
Comptez la fonction sur les lignes nuls
La fonction de nombre peut également être appliquée pour compter le nombre d'entrées (lignes) renvoyées par une expression. Si l'une des entrées renvoyées par l'expression est nul, la fonction de comptage ne comptera pas et ne l'exclura pas du résultat. Dans cet exemple, nous appliquerons la fonction de décompte sur la colonne ayant au moins une valeur nul.
S_no | prénom | nom de famille |
---|---|---|
1 | Dwayne | Johnson |
2 | Vin | Diesel |
3 | Sera | Forgeron |
4 | Robert | Downey Jr. |
5 | Chris | NUL |
6 | Leonardo | Dicaprio |
Appliquer la fonction de décompte sur le nom de famille colonne du Redshift_count_function tableau. Une ligne a une valeur nulle, donc la fonction de nombre ne compte pas cette ligne.
Sélectionnez Count (Last_name)
De redshift_count_function;
La sortie de la requête précédente sera la suivante lors de l'exécution:
compter
5
La sortie montre que la fonction de nombre ne compte que les lignes ayant certaines valeurs et rejette la ligne nul.
Comptez la fonction sur les lignes multiples
Maintenant, nous avons une table dans laquelle une colonne prénom Comprend plusieurs valeurs nulles. Ici, nous appliquerons la fonction de décompte sur le prénom colonne du Redshift_count_function table pour obtenir le nombre de lignes qui n'ont pas de valeur nulle.
S_no | prénom | nom de famille |
---|---|---|
1 | Dwayne | Johnson |
2 | NUL | Diesel |
3 | Sera | Forgeron |
4 | NUL | Downey Jr. |
5 | Chris | NUL |
6 | NUL | Dicaprio |
Appliquer la fonction de décompte sur le prénom colonne du Redshift_count_function table en utilisant la requête suivante. Trois lignes ont une valeur nulle, donc la fonction de comptage ne compte pas ces lignes.
Sélectionnez Count (First_name)
De redshift_count_function;
La sortie de la requête précédente sera la suivante lors de l'exécution:
compter
3
Compter la fonction à l'aide de (*) paramètre
Dans cet exemple, nous appliquerons la fonction de nombre à l'aide du paramètre (*). Ce paramètre est utilisé lorsque vous devez compter toutes les lignes, même si les lignes contiennent des valeurs nulles.
S_no | prénom | nom de famille |
---|---|---|
1 | Dwayne | Johnson |
2 | Vin | Diesel |
3 | Sera | Forgeron |
4 | Robert | Downey Jr. |
5 | Chris | NUL |
6 | Leonardo | Dicaprio |
Appliquer la fonction de décompte sur le redshift_count_functioN Tableau en exécutant la requête suivante:
Sélectionnez Count (*)
De redshift_count_function;
La sortie de la requête précédente sera la suivante lors de l'exécution:
compter
6
Cet exemple montre que le paramètre (*) compte toutes les lignes même si une ligne contient des valeurs nulles.
Compter la fonction en utilisant un paramètre distinct
Dans cet exemple, nous utiliserons la fonction de nombre en appliquant le paramètre distinct. Ce paramètre ne compte qu'un nombre distinct de lignes et laisse des lignes en double.
S_no | IDENTIFIANT | prénom | nom de famille |
---|---|---|---|
1 | 11 | Dwayne | Johnson |
2 | 22 | Vin | Diesel |
3 | 33 | Sera | Forgeron |
4 | 44 | Robert | Downey Jr. |
5 | 55 | Chris | Hemsworth |
6 | 66 | Leonardo | Dicaprio |
7 | 77 | Dwayne | Johnson |
8 | 88 | Vin | Diesel |
9 | 99 | Sera | Forgeron |
dix | 1010 | Robert | Downey Jr. |
11 | 1111 | Chris | Hemsworth |
12 | 1212 | Leonardo | Dicaprio |
Appliquer la fonction de comptage en utilisant le paramètre distinct sur le nom de famille colonne de la table ci-dessus. Il n'y a que six lignes distinctes, donc la fonction de nombre ne comptera que les lignes distinctes.
Sélectionnez Count (Last_name distinct)
De redshift_count_function;
La sortie de la requête précédente sera la suivante lors de l'exécution:
compter
6
Comptez la fonction sur les lignes nulles en utilisant un paramètre distinct
Dans cet exemple, nous utiliserons la fonction de nombre sur la colonne ayant une ligne nul à l'aide d'un paramètre distinct.
S_no | IDENTIFIANT | prénom | nom de famille |
---|---|---|---|
1 | 11 | Dwayne | Johnson |
2 | 22 | Vin | Diesel |
3 | 33 | Sera | Forgeron |
4 | 44 | Robert | Downey Jr. |
5 | 55 | Chris | NUL |
6 | 66 | Sera | Forgeron |
Appliquer la fonction de comptage en utilisant le paramètre distinct sur le nom de famille colonne de ce tableau. Cela ne comptera que quatre lignes car une ligne a un null, et une ligne a une valeur en double.
Sélectionnez Count (Last_name distinct)
De redshift_count_function;
La sortie de la requête précédente sera la suivante lors de l'exécution:
compter
4
Conclusion
Dans cet article, nous avons étudié comment utiliser la fonction de nombre pour compter le nombre de lignes renvoyées par une expression. La fonction de nombre peut être appliquée pour compter le nombre total de lignes et les lignes uniques qu'en spécifiant le paramètre distinct. Afin de compter toutes les lignes, y compris les valeurs nulles, utilisez la fonction de nombre avec le paramètre (*).