Colonnes pandas

Colonnes pandas
Une grille rectangulaire appelée Pandas DataFrame est utilisée pour stocker des données. Les données enregistrées dans une dataframe sont simples à visualiser et à manipuler. Le dataframe peut être composé de plusieurs lignes et colonnes. Chaque ligne représente une mesure d'une seule instance, tandis que chaque colonne est un vecteur contenant les données d'un attribut ou d'une variable spécifique. Les lignes de dataframe peuvent avoir des données hétérogènes ou homogènes dans une ligne donnée, mais chaque colonne de dataframe contient des données homogènes dans une colonne donnée. Les axes d'une dataframe dans les pandas sont étiquetés, contrairement à ceux d'un tableau bidimensionnel. Dans cet article, nous discutons des différentes méthodes pour ajouter, modifier et supprimer les colonnes ou les valeurs de Pandas dans les colonnes d'une dataframe dans Pandas. Cela peut être fait par diverses méthodes. Voyons certaines de ces méthodes en détail.

Comment ajouter des colonnes ou des valeurs à une colonne en pandas

Des colonnes peuvent être ajoutées à une dataframe en utilisant les plusieurs méthodes. Dans l'exemple suivant, nous utilisons les fonctions applicables () et insert () pour ajouter des colonnes à notre dataframe.

Exemple 1: Ajouter une colonne à DataFrame à l'aide de la fonction appliquer ()
Vous pouvez ajouter plusieurs colonnes à un dataframe en utilisant les pandas.Trame de données.Assign () Méthode. Tout d'abord, nous créons un exemple de dataframe à l'aide du PD.Fonction DataFrame () avec certaines lignes et colonnes. La bibliothèque «Pandas» est importée en premier pour créer le Pandas DataFrame.

Nous avons créé le DataFrame «DF» en passant un dictionnaire avec deux clés - «C1» et «C2» - avec des valeurs [«A», «B», «C»] et [«D», «E», «F "] respectivement. En passant le dictionnaire en PD.DataFrame, les touches deviennent l'étiquette des colonnes et les valeurs de la liste deviennent les données de chaque cellule dans les colonnes du DataFrame.

Comme on peut le voir, nous avons créé un dataframe avec deux colonnes maintenant. À l'aide de la fonction attribution (), nous ajoutons d'autres colonnes ou colonnes à notre DataFrame «DF».

La fonction donne à une nouvelle dataframe «new_df» qui contient à la fois la colonne supplémentaire (nouvellement ajoutée «C3») et toutes les anciennes colonnes («C1» et «C2»). Gardez à l'esprit que si des colonnes actuelles sont réaffectées, toutes seront écrasées.

Exemple 2: Ajouter une colonne à DataFrame à l'aide de la fonction insert ()
Le «dataframe.La méthode insert () ”peut également être utilisée pour ajouter des colonnes à un dataframe. Créons d'abord un dataframe avec quelques lignes et colonnes.

Pour afficher notre DataFrame «DF», la fonction print () est utilisée.

Notre DataFrame a deux lignes - A et B - avec des valeurs [«1», «2», «3»] et [«4», «5», «6»] respectivement. Maintenant, nous utilisons la méthode insert () pour ajouter une autre colonne dans le DataFrame «DF».

Avant d'utiliser la fonction insert (), nous avons créé une liste ayant des valeurs [«7», «8», «9»]. L'indexation des colonnes par DataFrame commence à zéro. Lorsque nous avons appliqué la fonction insert () avec le DataFrame «DF», nous avons spécifié l'index 1 pour placer la nouvelle colonne «C». Nous avons également passé la liste des «valeurs» dans les paramètres de la fonction insert () pour stocker les valeurs de la colonne «C».

Vous pouvez remarquer que notre nouvelle colonne est ajoutée au 2nd Emplacement de la colonne entre «A» et «B» parce que nous avons spécifié l'index «1» dans les paramètres de la fonction insert ().

Comment sélectionner les colonnes en pandas

Les colonnes peuvent être sélectionnées par leurs positions d'index, étiquettes ou données. Nous verrons comment sélectionner les colonnes spécifiques et multiples dans les exemples suivants.

Exemple 1: Sélectionnez une colonne spécifique à l'aide des noms / étiquettes de colonne
Nous créons un exemple de dataframe pour vous montrer comment vous pouvez sélectionner une colonne spécifique du DataFrame.

Nous avons créé le DataFrame avec des colonnes «Col1» et «Col2». Le moyen le plus simple d'obtenir une colonne de données de données spécifique consiste à écrire le nom de la colonne sous forme de chaîne avec des citations entre parenthèses [].

Dans le dataframe donné, nous avons deux colonnes numériques - «Col1» et «Col2» - ayant respectivement les valeurs (3, 1, 5) et (7, 2, 6).

En utilisant une liste avec plusieurs noms des colonnes DataFrame dans les supports «[]», vous pouvez sélectionner plusieurs colonnes.

Comme on peut le voir, nous avons passé une liste contenant les deux noms de colonne «COL1» et «COL2» dans les supports.

Exemple 2: Sélectionnez une colonne spécifique par leur type de données
Nous créons un dataframe ayant des colonnes avec différents données.

La colonne «Nom» stocke les noms des personnes («Tim», «Alex», «Joe», «Rick»). Alors que la colonne «Âge» stocke l'âge des personnes (12, 11, 11, 13). Vérifions les données de nos colonnes DataFrame en utilisant l'attribut "dtypes".

Le type de données de la colonne «Nom» est «objet» et «int64» est le type de données de la colonne «Age». Maintenant, nous sélectionnons les colonnes par leur type de données à l'aide de la fonction «loc []».

À l'intérieur du DF.Fonction loc [], nous avons spécifié le dtypes == 'int64'. Les valeurs sont renvoyées lorsque le type de données est «int64» en utilisant le «.Attribut de valeurs »avec df.loc [:, (df.DTYPES == 'INT64') Fonction.

Exemple 3: sélectionnez plusieurs colonnes par leurs index
Nous créons un nouvel exemple de dataframe pour vous montrer comment sélectionner plusieurs ou toutes les colonnes du DataFrame à l'aide de la méthode «Iloc []».

Puisque nous avons créé notre DataFrame, nous utilisons maintenant la méthode ILOC [] pour sélectionner plusieurs colonnes dans notre DataFrame. Lorsqu'une seule colonne est sélectionnée, la méthode Iloc [] renvoie un objet série. Lorsque plus de 1 colonne est sélectionnée, un pandas dataframe est renvoyé.

Nous avons spécifié la plage d'index des colonnes de 0 à 3. Notez que la colonne de l'index 3 ne fait pas partie du groupe. Seules les colonnes de l'index 0 à 2 sont sélectionnées.

Comme on peut le voir, les colonnes «W», «X» et «Y» sont sélectionnées en spécifiant la plage 0: 3.

Comment modifier les noms de colonne et les valeurs de colonne

Dans l'exemple suivant, nous modifierons les noms de colonne à l'aide de la fonction Rename () et modifier les valeurs à l'aide de la fonction Remplace ().

Exemple 1: Modifiez l'étiquette de la colonne à l'aide de la fonction Rename ()
Tout d'abord, nous créons un dataframe ayant une ou plusieurs colonnes.

Une fois le dataframe créé, nous pouvons renommer sa colonne en utilisant la fonction Pandas Rename (). À l'intérieur de la fonction Rename (), nous utilisons un dictionnaire comme original_label: new_label. Et nous spécifions l'étiquette actuelle et la nouvelle étiquette (que nous voulons ajouter).

Comme vous pouvez l'observer, nous avons changé le nom de la colonne «A» en «Nom» et le nom de la colonne «B» en «Subject».

Exemple 2: Modifiez les valeurs de la colonne à l'aide de la fonction remplace ()
Nous créons un dataframe ayant le nombre de colonnes stockant des valeurs. Ensuite, nous modifions les valeurs des colonnes à l'aide de la fonction Remplace ().

Puisque nous avons créé notre DataFrame, changeons maintenant les valeurs de sa colonne à l'aide de la fonction Remplace (). La méthode remplace () échange la valeur dans la colonne DataFrame par la nouvelle valeur spécifiée.

La fonction Replace () a remplacé la valeur de la colonne «x» de la colonne «5» à 9.

Comment retirer les colonnes Pandas

Les colonnes DataFrame peuvent être supprimées à l'aide de la méthode Drop () et Del dans Pandas.

Exemple: Suppression d'une colonne d'un Pandas DataFrame
Créons d'abord un dataframe à partir duquel nous supprimerons les colonnes spécifiques à l'aide de drop () et de méthodes.

Nous avons un dataframe «df» avec 4 colonnes («A», «B», «C», «D»). La méthode Drop () de DataFrame supprime les lignes ou les colonnes en fonction des axes correspondants et des noms de colonne (étiquette) spécifiés. Supprimons la colonne «A» à l'aide de la fonction Drop ().

L'axe = 1 indique que nous supprimons la colonne, pas la ligne.

La fonction Drop () a supprimé avec succès la colonne «A». Maintenant, utilisons la méthode «del» sur la colonne «D».

La colonne «D» est supprimée du dataframe à l'aide de la méthode «del».

Conclusion

Dans ce tutoriel, nous avons discuté des colonnes dans le Pandas DataFrame. Nous avons utilisé les différentes fonctions pour ajouter, modifier et supprimer les colonnes de notre DataFrame. Ce tutoriel est conçu pour enseigner les différentes opérations que vous pouvez effectuer sur une colonne de DataFrame à Pandas. Nous avons implémenté plusieurs exemples pour vous apprendre comment vous pouvez ajouter des colonnes ou des valeurs dans une colonne, comment sélectionner les colonnes, comment modifier les noms de colonnes et les valeurs de colonne, et comment supprimer la colonne d'un Pandas DataFrame.