Il a principalement deux formes: série et dataframe. La «série» contient des données concernant une seule variable et peut être considérée comme un vecteur avec des informations indexées, tandis que «DataFrame» est une structure de données tabulaire.
Dans ce tutoriel, nous traverserons brièvement certains des exercices de pandas les plus fréquemment utilisés pour les débutants. Vous recevrez un instantané du script Python avec la sortie correspondante pour chaque exercice.
Bibliothèque d'importation
Pour commencer à travailler sur des exercices Pandas, nous devons d'abord charger la bibliothèque «Pandas» dans notre fichier de projet. L'outil que nous utilisons pour la mise en œuvre des exercices Pandas est «Spyder». Nous avons lancé l'outil et chargé la bibliothèque Pandas dans le fichier Python en écrivant le script «Importer des pandas en pd». Nous avons aliasé des pandas comme «PD». Maintenant, «PD» peut être utilisé à la place des «pandas» tout au long du programme.
Exercice n ° 1: Conversion d'une liste en série
Le premier exercice que nous avons choisi d'enseigner est de générer des séries Pandas à partir d'une liste.
Nous avons créé une variable «mannequin» et lui avons attribué une liste de valeurs comme «1», «2», «3», «4», «5», «6» et «7». Nous avons invoqué le «PD.Série () ”fonctionne et passa la liste« mannequin »comme paramètre. La série résultante sera stockée dans la variable «converti». Pour montrer le contenu à l'écran, les pandas nous fournissent une méthode de «print ()». Nous avons affiché la série «Converti» en utilisant la fonction «print ()».
L'instantané de sortie correspondant montre qu'une série a été générée avec des index par défaut.
Exercice n ° 2: Conversion d'une liste en une série en utilisant des index spécifiés
Le premier exercice a démontré avec précision la conversion d'une liste en une série Pandas. Nous avons vu dans l'image de sortie que la liste a été présentée avec la liste par défaut des index. Si vous ne voulez pas que votre série soit affichée avec ces index, vous pouvez le modifier en fournissant des index spécifiés.
Nous avons utilisé la liste à partir de l'instance ci-dessus. Pour convertir la liste en série et définir les index, nous avons appelé le «PD.Série () ”Fonction. Deux paramètres ont été transmis à cette fonction: list_name et index. Le nom de la liste «mannequin» est fourni. L'argument «Index» est utilisé pour modifier la liste d'index par défaut avec celle que l'utilisateur a donné. Nous avons personnalisé la liste d'index avec les valeurs «A», «B», «C», «D», «E», «F» et «G». La série avec une liste d'index mise à jour est stockée dans la variable «Converti» puis exposée via la fonction «print ()».
Dans l'image résultante, les index par défaut ont été remplacés par la liste d'index fournis par l'utilisateur.
Exercice n ° 3: Conversion des listes en un dataframe
Dans le premier exercice, nous avons appris à convertir une liste en une série Pandas. Maintenant, nous verrons comment convertir les listes en un pandas dataframe.
Trois listes ont été générées dans le script. Ces listes ont des valeurs «[« Harry », 25,« Ingénieur »]», «[« Roma », 32,« Doctor »]», et «[« Elizia », 22,« artiste »]» respectivement. Nous avons stocké ces listes dans un objet de liste 2D «L1». Maintenant, pour convertir «L1» en un pandas dataframe, nous avons une fonction Pandas «PD.Trame de données()". Cette fonction a été invoquée et la liste 2D est fournie comme un paramètre avec un autre paramètre «colonnes». DataFrame montre les données sous forme de tableaux ayant des lignes et des colonnes, de sorte que le paramètre "Colonnes" mettra les étiquettes aux colonnes du DataFrame. Chaque liste a 3 valeurs, ce qui signifie que nous aurons 3 colonnes dans le dataframe. Nous avons spécifié les étiquettes comme «nom», «âge» et «profession». Le DataFrame est stocké dans l'objet DataFrame «Demo».
L'exécution du programme nous donne un dataframe avec 3 colonnes avec les étiquettes et les valeurs spécifiées qui ont été générées à partir de la liste 2D fournie.
Exercice n ° 4: Convertir un dictionnaire en DataFrame
Un dictionnaire Pandas est une collection de listes. Pour apprendre la conversion d'un dict à un dataframe, nous devons d'abord créer un dictionnaire. Un dictionnaire «Sample_Dict» avec 3 listes de valeurs a été créé. La première liste «Col1» a des valeurs «Harry», «Roma» et «Elizia». La liste «COL2» stocke les données «25», «32» et «22». La liste «COL3» a des entrées «ingénieur», «docteur» et «artiste». Pour construire un dataframe à partir du dict «Sample_Dict», nous avons invoqué le «PD.Méthode DataFrame () »et a passé le dictionnaire en tant que paramètre. Quand le «PD.La méthode DataFrame () »s'exécute, il prendra le contenu du dictionnaire et les modifiera dans le dataframe. Le DataFrame converti est stocké dans l'objet DataFrame «Modifier» et s'affiche sur la console en utilisant la méthode «print ()».
Ce programme lorsqu'il est exécuté, nous donne la sortie indiquée dans l'instantané ci-dessous.
Exercice n ° 5: Spécification de l'index dans DataFrame
Lorsque nous présentons le DataFrame ou une série sur le terminal, il est principalement équipé de la liste d'index par défaut qui commence de «0» jusqu'à la longueur de l'ensemble de données. Nous avons appris à le changer dans la série et vous pouvez également le modifier dans le dataframe.
Nous avons utilisé le dataframe généré dans l'exercice ci-dessus. Vous pouvez voir que le DataFrame a un index de «0», «1» et «2». Nous modifierons ce comportement par défaut en fournissant notre liste d'index. Entre les accolades du «PD.Méthode dataframe () », le nom du dictionnaire« Sample_Dict »et« Index »est fourni. Les index ont été spécifiés comme «X», «Y» et «Z».
Le DataFrame avec la liste d'index mis à jour s'affiche à l'écran.
Exercice n ° 6: Extraction de la colonne spécifiée dans un dataframe
Pour sélectionner une colonne particulière dans un DataFrame, nous utiliserons le DataFrame précédent avec les index par défaut. Après avoir imprimé la dataframe initiale, nous avons utilisé le «DF.LOC [index, colonne] »Méthode. Comme nous voulons sélectionner une colonne, nous avons quitté «l'index» en fournissant «:» et avons fourni le nom de la colonne «Col2» entre ses parenthèses. La colonne sélectionnée est conservée dans la variable «SELECT» et présentée à l'aide de la fonction «print ()».
Ceci est le résultat du script ci-dessus:
Exercice n ° 7: Extraction de lignes particulières dans un dataframe
Certaines lignes peuvent également être sélectionnées dans un dataframe en suivant la même technique que pour la sélection des colonnes avec une seule exception. Pour la sélection des lignes, nous devons fournir l'index dans le «PD.Loc [] ”Méthode et mettre le colon«: »à la colonne. Les lignes que nous avons sélectionnées sont «1» et «2».
Les deux lignes sélectionnées ont été exposées.
Exercice n ° 8: remplir les valeurs manquantes dans un dataframe
Nous avons créé une dataframe avec quelques valeurs manquantes et l'avons imprimée à l'écran. Pour remplir ces valeurs, nous avons invoqué le «DF.Fillna () ”Méthode. La valeur que nous voulons être remplacées par les entrées nulles est «0». Donc, nous l'avons placé dans le «DF.Fillna () ”Braces de la fonction. La variable «remplissage» est de stocker le résultat et la méthode «print ()» l'affichera.
Ici, vous pouvez voir que les valeurs nulles sont maintenant remplacées par 0.
Conclusion
Pandas nous fournit une grande variété de choix pour résoudre des problèmes d'analyse de données réels. Cela fonctionne principalement avec les dataframes et les séries. Certains exercices les plus courants ont été discutés dans cet article concernant les fonctions de la série des pandas ainsi que les fonctions de dataframe des pandas. Nous avons élaboré 8 techniques d'apprentissage de base des pandas. Les concepts sont comprises grâce à la démonstration pratique du script Python sur l'outil Spyder. Tous ces exercices sont le meilleur guide du débutant pour commencer par Python Pandas Dataframes et Series.