Pyspark - Méthode Afficher

Pyspark - Méthode Afficher
Dans Python, Pyspark est un module Spark utilisé pour fournir un type de traitement similaire comme Spark en utilisant DataFrame. Il fournit la méthode show (), qui affiche le dataframe dans un format tabulaire.

Syntaxe:

Trame de données.Show (n, vertical, tronqué)

Où DataFrame est l'entrée pyspark dataframe

Paramètres:

1. n est le premier paramètre facultatif représentant une valeur entière pour obtenir les lignes supérieures dans le dataframe, et n représente le nombre de lignes supérieures à afficher. Par défaut, il affichera toutes les lignes à partir du dataframe

2. Le paramètre vertical prend des valeurs booléennes, qui sont utilisées pour afficher le dataframe dans le paramètre vertical lorsqu'il est défini sur true. et afficher le dataframe au format horizontal lorsqu'il est défini sur faux. Par défaut, il s'affichera en format horizontal

3. Truncate est utilisé pour obtenir le nombre de caractères de chaque valeur dans le dataframe. Il faudra un entier comme certains caractères pour être affiché. Par défaut, il affichera tous les caractères.

Exemple 1:

Dans cet exemple, nous créerons un Pyspark DataFrame avec 5 lignes et 6 colonnes et afficherons le DataFrame en utilisant la méthode Show () sans aucun paramètre.

Cela se traduit donc par un DataFrame tabulaire en affichant toutes les valeurs dans le dataframe

#IMPORT LE MODULE PYSPAPRK
Importer Pyspark
#mport Sparkcession pour la création d'une session
de Pyspark.SQL IMPORT SPARKSESSE
#create une application nommée Linuxhint
Spark_App = Sparkcession.constructeur.appname ('Linuxhint').getorCreate ()
# Créer des données étudiants avec 5 lignes et 6 attributs
étudiants = ['rollno': '001', 'name': 'sravan', 'Âge': 23, 'height': 5.79, «poids»: 67, «adresse»: «guntur»,
'rollno': '002', 'name': 'ojaswi', 'Âge': 16, 'height': 3.79, «poids»: 34, «adresse»: «hyd»,
'rollno': '003', 'name': 'gnanesh chowdary', 'Âge': 7, 'height': 2.79, «poids»: 17, «adresse»: «patna»,
'rollno': '004', 'name': 'rohith', 'Âge': 9, 'height': 3.69, «poids»: 28, «adresse»: «hyd»,
'rollno': '005', 'name': 'sridevi', 'Âge': 37, 'height': 5.59, «poids»: 54, «adresse»: «hyd»]
# Créer le DataFrame
df = spark_app.CreatedataFrame (étudiants)
# trame de données
df.montrer()

Sortir:

Exemple 2:

Dans cet exemple, nous créerons un Pyspark DataFrame avec 5 lignes et 6 colonnes et afficherons le DataFrame en utilisant la méthode Show () avec le paramètre N. Nous définissons la valeur n sur 4 pour afficher les 4 premières lignes de la dataframe.

Cela se traduit donc par un dataframe tabulaire en affichant 4 valeurs dans le dataframe.

#IMPORT LE MODULE PYSPAPRK
Importer Pyspark
#mport Sparkcession pour la création d'une session
de Pyspark.SQL IMPORT SPARKSESSE
#create une application nommée Linuxhint
Spark_App = Sparkcession.constructeur.appname ('Linuxhint').getorCreate ()
# Créer des données étudiants avec 5 lignes et 6 attributs
étudiants = ['rollno': '001', 'name': 'sravan', 'Âge': 23, 'height': 5.79, «poids»: 67, «adresse»: «guntur»,
'rollno': '002', 'name': 'ojaswi', 'Âge': 16, 'height': 3.79, «poids»: 34, «adresse»: «hyd»,
'rollno': '003', 'name': 'gnanesh chowdary', 'Âge': 7, 'height': 2.79, «poids»: 17, «adresse»: «patna»,
'rollno': '004', 'name': 'rohith', 'Âge': 9, 'height': 3.69, «poids»: 28, «adresse»: «hyd»,
'rollno': '005', 'name': 'sridevi', 'Âge': 37, 'height': 5.59, «poids»: 54, «adresse»: «hyd»]
# Créer le DataFrame
df = spark_app.CreatedataFrame (étudiants)
# Obtenez les 4 meilleures lignes dans le dataframe
df.show (4)

Sortir:

Exemple 3:

Dans cet exemple, nous créerons un Pyspark DataFrame avec 5 lignes et 6 colonnes et afficherons le DataFrame en utilisant la méthode Show () avec un paramètre vertical. Nous définissons Vertical sur False pour afficher le dataframe en vue horizontale.

Cela se traduit donc par un dataframe tabulaire en affichant toutes les valeurs en vue horizontale.

#IMPORT LE MODULE PYSPAPRK
Importer Pyspark
#mport Sparkcession pour la création d'une session
de Pyspark.SQL IMPORT SPARKSESSE
#create une application nommée Linuxhint
Spark_App = Sparkcession.constructeur.appname ('Linuxhint').getorCreate ()
# Créer des données étudiants avec 5 lignes et 6 attributs
étudiants = ['rollno': '001', 'name': 'sravan', 'Âge': 23, 'height': 5.79, «poids»: 67, «adresse»: «guntur»,
'rollno': '002', 'name': 'ojaswi', 'Âge': 16, 'height': 3.79, «poids»: 34, «adresse»: «hyd»,
'rollno': '003', 'name': 'gnanesh chowdary', 'Âge': 7, 'height': 2.79, «poids»: 17, «adresse»: «patna»,
'rollno': '004', 'name': 'rohith', 'Âge': 9, 'height': 3.69, «poids»: 28, «adresse»: «hyd»,
'rollno': '005', 'name': 'sridevi', 'Âge': 37, 'height': 5.59, «poids»: 54, «adresse»: «hyd»]
# Créer le DataFrame
df = spark_app.CreatedataFrame (étudiants)
# Obtenez le dataframe de manière horizontale
df.montrer (vertical = false)

Sortir:

Exemple 4:

Dans cet exemple, nous créerons un Pyspark DataFrame avec 5 lignes et 6 colonnes et afficherons le DataFrame en utilisant la méthode Show () avec un paramètre vertical. Nous définissons Vertical sur True pour afficher le dataframe en vue verticale.

Cela se traduit donc par un dataframe tabulaire en affichant toutes les valeurs en vue verticale.

#IMPORT LE MODULE PYSPAPRK
Importer Pyspark
#mport Sparkcession pour la création d'une session
de Pyspark.SQL IMPORT SPARKSESSE
#create une application nommée Linuxhint
Spark_App = Sparkcession.constructeur.appname ('Linuxhint').getorCreate ()
# Créer des données étudiants avec 5 lignes et 6 attributs
étudiants = ['rollno': '001', 'name': 'sravan', 'Âge': 23, 'height': 5.79, «poids»: 67, «adresse»: «guntur»,
'rollno': '002', 'name': 'ojaswi', 'Âge': 16, 'height': 3.79, «poids»: 34, «adresse»: «hyd»,
'rollno': '003', 'name': 'gnanesh chowdary', 'Âge': 7, 'height': 2.79, «poids»: 17, «adresse»: «patna»,
'rollno': '004', 'name': 'rohith', 'Âge': 9, 'height': 3.69, «poids»: 28, «adresse»: «hyd»,
'rollno': '005', 'name': 'sridevi', 'Âge': 37, 'height': 5.59, «poids»: 54, «adresse»: «hyd»]
# Créer le DataFrame
df = spark_app.CreatedataFrame (étudiants)
# Obtenez le dataframe de manière verticale
df.montrer (vertical = true)

Sortir:

Exemple 5:

Dans cet exemple, nous créerons un Pyspark DataFrame avec 5 lignes et 6 colonnes et afficherons le DataFrame en utilisant la méthode Show () avec un paramètre tronqué. Nous définissons la valeur tronquée sur 1 pour afficher le premier caractère dans chaque ligne de DataFrame.

Cela se traduit donc par un dataframe tabulaire en affichant le premier caractère en vue horizontale.

#IMPORT LE MODULE PYSPAPRK
Importer Pyspark
#mport Sparkcession pour la création d'une session
de Pyspark.SQL IMPORT SPARKSESSE
#create une application nommée Linuxhint
Spark_App = Sparkcession.constructeur.appname ('Linuxhint').getorCreate ()
# Créer des données étudiants avec 5 lignes et 6 attributs
étudiants = ['rollno': '001', 'name': 'sravan', 'Âge': 23, 'height': 5.79, «poids»: 67, «adresse»: «guntur»,
'rollno': '002', 'name': 'ojaswi', 'Âge': 16, 'height': 3.79, «poids»: 34, «adresse»: «hyd»,
'rollno': '003', 'name': 'gnanesh chowdary', 'Âge': 7, 'height': 2.79, «poids»: 17, «adresse»: «patna»,
'rollno': '004', 'name': 'rohith', 'Âge': 9, 'height': 3.69, «poids»: 28, «adresse»: «hyd»,
'rollno': '005', 'name': 'sridevi', 'Âge': 37, 'height': 5.59, «poids»: 54, «adresse»: «hyd»]
# Créer le DataFrame
df = spark_app.CreatedataFrame (étudiants)
# Obtenez le DataFrame en obtenant uniquement le premier caractère dans chaque ligne
df.Show (truncate = 1)

Sortir:

Conclusion

Cet article a discuté de la méthode Show () dans Pyspark et sa fonctionnalité. Nous avons considéré tous les paramètres avec des valeurs pour le dataframe pour afficher le dataframe au format tabulaire.