Comment utiliser la fonction Assign () dans Pandas
Pour utiliser la fonction attribution () en pandas, nous devons d'abord comprendre sa syntaxe.
Syntaxe: Trame de données.Attribuer (** les arguments de mots clés, soi)
Où,
Arguments de mots clés: Les noms de colonne et les slogans servent d'arguments de mots clés. Si les qualités peuvent être appelées, le DataFrame les traite et les attribue aux nouvelles colonnes DataFrame. Même si les pandas ne le vérifient pas, le callable ne peut pas modifier le dataframe d'entrée. Si les propriétés, telles que les séries ou les clusters, ne sont pas appelables. Dans un sens, ils sont attribués. Un dictionnaire de chaînes ou de listes peut être utilisé comme arguments de mots clés.
soi: Il renvoie une tradition de données entièrement nouvelle avec des colonnes qui ont été ajoutées à celles existantes en tant que sortie.
Nous pouvons maintenant comprendre comment fonctionne la fonction Assign () de Pandas. En tout état de cause, nous ne pouvons pas réduire de manière significative la taille de notre DataFrame car le nombre total de 64 octets occupe la même quantité d'espace que 64 octets de cordes ou de valeurs de points flottants, un peu comme 100 livres de briques pèsent la même chose que 100 livres de blocs. Nous avons simplifié le processus de découragement ultérieur de ces segments. Nous avons incroyablement peu de caractéristiques ici, donc si nous créons une capacité qui prend un sous-ensemble d'un sous-ensemble de colonne et essaie de le déterminer à la plus petite forme qu'il peut prendre, il devrait pouvoir fonctionner. Les exemples suivants vous aideront à mieux le comprendre.
Exemple 1: Utilisation de la fonction Assign () dans Pandas
La température sera calculée dans cet exemple en utilisant la méthode Assign (). Alors que le module Numpy fonctionne principalement avec des données numériques, le module Pandas fonctionne principalement avec les données tabulaires. Après l'importation des modules, nous créerons un dataframe sur lequel nous pouvons appliquer la fonction Assign ().
La fonction lambda a le même potentiel pour se comporter qu'une fonction standard spécifiée en utilisant le mot-clé DEF de Python. Nous pouvons voir notre trame de données en utilisant la fonction print () et passer le nom de notre trame de données après avoir appliqué la fonction Assign (), I.e., «Df_assign» comme argument dans la fonction print (). Vous pouvez également l'illustrer en écrivant simplement le nom du cadre de données.
Numpy est importé après les pandas dans le script mentionné précédemment. Les températures des deux pays sont ensuite enregistrées car nous générons l'indice DataFrame et DataFrame pour eux. Enfin, nous utilisons la méthode attribution () pour calculer les températures en utilisant l'équation fournie par le programme. Lorsque nous attribuons la fonction d'impression, la variable DF, qui représente le dataframe, calcule l'équation mathématique et imprime la sortie précédemment vue. La fonction attribution () calibre l'équation, qui considère les variables. Pour convertir des degrés Fahrenheit en degrés Celsius, 32 est ajouté aux valeurs de cette variable «A» avec Lambda. Ensuite, la commande complète cette équation et publie les résultats.
Exemple 2: nouvelle création variable et une affectation constante
Avant d'exécuter l'un de ces exemples, vous devez importer des pandas et faire le dataframe nécessaire.
Nous avons nommé nos données de «s-data». Ce dataframe comprend des variables pour les ventes et les dépenses et les données simulées pour les ventes pour chaque individu. Nous pouvons ajouter des variables supplémentaires à partir d'ici en utilisant la méthode Assign ().
Si toutes les personnes de cet ensemble de données sont employées par la même entreprise ou la même entreprise, disons que vous travaillez avec ces informations. Contrairement à «S_DATA», qui ne contient que des données d'employés qui travaillent pour la même entreprise, d'autres dataframes peuvent avoir des enregistrements pour les vendeurs qui travaillent pour diverses entreprises. Et si nous voulions faire une variable pour les individus de ce DataFrame qui contenaient le nom de leur entreprise? Avec la fonction attribution (), nous pouvons accomplir ce qui suit:
Nous avons ajouté une nouvelle variable nommée «Business» dans ce cas. La valeur de la variable commerciale est la même pour chaque rangée de données. Il dit le «matériel» comme valeur. Techniquement parlant, la valeur est la même pour chaque ligne. C'est une valeur de chaîne, pour être plus précis. Ayant déclaré que, tout en créant des variables avec des valeurs constantes, avec des données ou une valeur numériques continues, nous pouvons attribuer une nouvelle variable en plus d'ajouter des valeurs textuelles comme dans cet exemple.
Exemple 3: Ajoutez une variable de valeur calculée avec la méthode Assign ()
Nous utiliserons le même cadre de données «S_DATA» dans cet exemple. Pour être plus précis, nous ajouterons le «profit» en tant que nouvelle variable, des ventes égales moins les coûts (les experts en finance et en comptabilité sauront que ce n'est pas une méthode exacte de calcul du profit; cependant, nous utiliserons ce calcul asymétrique comme exemple.).
En utilisant ce code, nous obtiendrons la sortie suivante:
Dans ce cas, nous avons ajouté une nouvelle colonne calculée nommée «Profit». Le profit, comme on peut le voir, ne sont que des dépenses de soustraction des ventes. Cependant, n'oubliez pas que nous devons utiliser les noms «S_DATA.Ventes "et" S_DATA.dépenses »pour faire référence aux variables de vente et de dépenses à l'intérieur d'Assign (). Nous pourrions également les qualifier de «s_data [« dépenses »]» et «s_data [« ventes »]». Vous pouvez en choisir n'importe lequel, mais pour cet exemple, le précédemment affiché sera utilisé.
Exemple 4: Ajout de plusieurs colonnes à l'aide de la fonction Assign ()
Nous ajouterons deux variables simultanément dans cet exemple. Les variables «Business» et «Profit» seront ajoutées. Nous utiliserons le même cadre de données des exemples précédents 2 et 3, i.e., s_data.
Les variables «profit» et «entreprise» sont ajoutées simultanément dans cet exemple. Vous verrez que nous avons commencé une nouvelle ligne de code pour la deuxième variable en termes de syntaxe. Vous pouvez conserver tout votre code sur une seule ligne si vous le souhaitez, bien que je ne le suggère pas particulièrement. L'écrasement direct de vos données d'origine est une autre option.
Exécutez simplement la méthode Assign et envoyez les résultats au «S_DATA» DataFrame spécifié dans le nom d'origine DataFrame. Dans certaines situations, le faire est entièrement approprié. Vous pouvez parfois remplacer vos données complètement.
Conclusion
Nous allons résumer en disant que la fonction attribution () dans Pandas nous permet d'effectuer diverses affectations car nous créons une référence mot des noms de section. Dans ce didacticiel, nous avons implémenté différents exemples pour vous apprendre à utiliser la fonction Attribute (), comment ajouter une nouvelle colonne avec une valeur ou des données constante, comment ajouter une colonne avec des valeurs calculées et comment ajouter plusieurs colonnes dans un DataFrame Utilisation de la fonction attribution ().