Pandas nouvelle colonne basée sur une autre colonne

Pandas nouvelle colonne basée sur une autre colonne
Cet article illustrera deux méthodes que vous pouvez utiliser pour créer une nouvelle colonne basée sur la valeur d'une autre colonne au sein d'un Pandas DataFrame.

Exemple de dataframe.

Dans ce tutoriel, nous utiliserons un exemple de dataframe comme indiqué ci-dessous:

En utilisant des pandas appliquer la fonction

La première façon la plus pratique d'ajouter une nouvelle colonne basée sur une autre consiste à utiliser la fonction Pandas Appliquer.

Supposons que nous voulons retourner la note d'un film en pourcentage, nous pouvons faire:

pourcentage def (x):
retour (x / 10) * 100
df ['% _ cote'] = df.IMDB_RATING.Appliquer (pourcentage)
df

Dans l'exemple ci-dessus, nous définissons une fonction qui prend la note de courant, divisée par 10, et la multiplie par 100.

Nous créons ensuite une nouvelle colonne appelée «% _rating» et passons la fonction définie par l'utilisateur comme un paramètre au Fonction appliquer ().

Cela devrait renvoyer le nouveau DataFrame comme indiqué:

En utilisant un fonctionnement sur les éléments

Nous pouvons également créer une nouvelle colonne à l'aide d'une opération d'élément au lieu de la fonction d'application.

Un exemple est illustré ci-dessous:

df ['% _ rating'] = (df ['imdb_rating'] / 10) * 100
df

Le code ci-dessus doit retourner:

Conclusion

Cet article a illustré deux méthodes principales de création d'une nouvelle colonne basée sur une valeur d'une autre colonne de Pandas.