Renommer les colonnes dans un Pandas DataFrame

Renommer les colonnes dans un Pandas DataFrame

Chaque jour, les gens gèrent d'énormes données que nous appelions les mégadonnées. Dans ce Big Data, il contient parfois des noms de colonne ou parfois sans les noms de colonne. Les noms de colonne sont là, mais ils contiennent un nom non pertinent ou des caractères indésirables comme les espaces, etc. Donc, nous devons d'abord prétraiter ces données énormes avant de commencer l'analyse. Donc, tout d'abord, nous avons besoin du renommée des noms de colonne.

Trame de données est des données tabulaires axées sur les lignes qui ont des lignes et des colonnes. Nous pouvons également dire que DataFrame est une collection de différentes colonnes et que chaque colonne est de différents types comme la chaîne, le numérique, etc.

$ pandas.Trame de données

Un pandas Trame de données peut être créé en utilisant le constructeur suivant

$ pandas.DataFrame (data = non, index = non, colonnes = aucun, dType = aucun, copy = false)

Méthode 1: Utilisation de Rename () Fonction:

Syntaxe:

df.renommer (colonnes = d, inplace = false)

Nous avons créé un Trame de données (df), que nous utiliserons pour afficher différentes méthodes Rename ().

Au dessus Trame de données, Nous pouvons voir que nous avons quatre colonnes ['Name', 'age', 'favori_color', 'grade'].

Les pandas ont une fonction intra-construite appelée renom () qui peut modifier le nom de la colonne instantanée. Pour l'utiliser, nous devons passer une clé (le nom d'origine de la colonne) et la valeur (le nouveau nom de la colonne) au formulaire de renommée sous l'attribut de colonne. Nous pouvons également utiliser une autre option en place pour True qui change directement vers l'existant Trame de données Par défaut, en place est fausse.

D'après le résultat ci-dessus, nous pouvons voir que les noms des colonnes ont changé.

Méthode 2: Utilisation de la méthode de la liste

Pandas Trame de données a également donné une colonne de nom d'attribut qui nous aide à accéder à tous les noms de colonne d'un Trame de données. Ainsi, en utilisant cet attribut de colonnes, nous pouvons également renommer le nom de la colonne. Nous devons passer une nouvelle liste de colonnes et attribuer à l'attribut des colonnes comme indiqué ci-dessous:

L'inconvénient principal de l'utilisation de la méthode de la liste pour renommer le nom d'une colonne est que nous devons passer tous les noms de colonne même si nous voulons changer seulement quelques noms de colonnes.

Méthode 3: Renommer le nom de la colonne à l'aide du fichier read_csv

Nous pouvons également renommer les colonnes pendant la lecture_csv elle-même. Pour cela, nous devons créer une liste de colonnes et passer cette liste comme paramètre à l'attribut de noms lors de la lecture du CSV.

Nous utilisons le tête-en-tête d'attribut = 0, ce qui signifie que nous employons les colonnes précédentes du .Fichier CSV avec les nouvelles colonnes que nous passons par l'attribut de noms.

Au dessus .Méthode CSV, nous renomnons les colonnes lors de l'utilisation de la liste, et nous passons toutes les nouvelles colonnes à l'intérieur de cette liste. Mais parfois, nous devons renommer seulement quelques colonnes. Ensuite, nous devons utiliser l'attribut UseCols et mentionner les valeurs d'index de ces colonnes à l'intérieur de celle-ci comme indiqué ci-dessous:

Dans ce qui précède, nous ne renomnons que la première et la dernière colonne du fichier CSV et pour cela, nous passons les valeurs d'index des colonnes (0 et 3) à l'attribut UseCols.

Méthode 4: Utilisation des colonnes.Str.remplacer()

Cette méthode est essentiellement utilisée lorsque nous voulons changer certaines phrases en d'autres phrases et ne pas vouloir changer la colonne complète renommer comme l'espace pour souligner, etc.

D'après le résultat ci-dessus, nous pouvons voir que maintenant les espaces remplaceront le soulignement.

La méthode ci-dessus a également la facilité de l'indice (DF.indice.Str.remplacer()).

Méthode 5: Colonnes de renommée à l'aide de set_axis ()

Cette méthode est utilisée pour renommer l'index avec la colonne comme indiqué ci-dessous:

Conclusion

Dans cet article, nous montrons différentes méthodes sur la façon de renommer les colonnes. La meilleure méthode que je considère est la méthode Rename () où nous devons passer uniquement les colonnes que nous voulons renommer au format dictionnaire (clé, valeur). L'attribut des colonnes est la méthode la plus simple, mais le principal inconvénient de cela est que nous devons passer toutes les colonnes même si nous voulons renommer seulement quelques colonnes. Nous pouvons également renommer les colonnes tout en lisant le fichier CSV lui-même, qui est également une bonne option. Les colonnes.Str.remplacer () est la meilleure option uniquement lorsque nous voulons remplacer certains caractères par d'autres caractères.