Pandas dataframe loc

Pandas dataframe loc
Un format de données tabulaires bidimensionnel et potentiellement mixte avec des axes étiquetés est appelé «Pandas Dataframe». Les étiquettes des lignes et des champs s'alignent sur les opérations arithmétiques. La structure de données principale des Pandas est représentée par ce. Pour accéder à un ensemble de lignes et de colonnes par des index ou un tableau booléen, nous utilisons le Pandas DataFrame.propriété LOC. Chaque fois que nous voulons accéder à une ligne ou à une colonne ou à plusieurs lignes et colonnes, nous utilisons le «DataFrame.propriété loc () ”. Nous ne pouvons également accéder qu'une seule valeur de la cellule en déterminant l'étiquette ou l'index de la ligne et de la colonne dans ce «DataFrame.Méthode loc () ”. Ce guide utilise le «DataFrame.LOC () ”Méthode et accédera à la ligne, à n'importe quelle colonne ou à toute valeur cellulaire avec cette méthode.

Syntaxe:

# Trame de données.localiser

Exemple 1:

Alors que nous effectuons le code Pandas, nous importons d'abord la fonction Pandas comme «PD» dans l'application «Spyder». Nous obtenons la fonction ou les méthodes de Pandas dont nous avons besoin en utilisant «PD» à la place des «pandas». Nous créons un dataframe ici qui est le «boys_df». Le «PD» est utilisé ici parce que le dataframe est la méthode des «pandas». Nous mettons le nom de la colonne comme en-tête de cette colonne et mettons les valeurs à l'intérieur de toutes les colonnes.

Ici, la première colonne de "Boys_df" est "b_height" où nous insérons la hauteur des garçons. Ces hauteurs sont «5.5, 6.0, 5.7, 5.8, 5.4, 6 et 5.9 ”. La deuxième colonne du «garçons_df» est «b_name» qui contient les noms des garçons. Les noms des garçons que nous insérons ici sont «Sam, Rishi, Alexander, Robin, Thomas, Samuel et Taylor». La colonne suivante que nous avons dans le «Boys_DF» est «B_age» qui contient l'âge des garçons - «19, 25, 27, 18, 21, 22 et 28». Nous ajoutons trois colonnes dans le DataFrame «Boys_DF».

Nous définissons également les valeurs d'index des lignes du «Boys_DF». Ces valeurs d'index sont «R # 1, R # 2, R # 3, R # 4, R # 5, R # 6 et R # 7». Ces valeurs apparaissent comme l'index de chaque ligne car nous définissons ces valeurs comme «Boys_DF.indice". Maintenant, nous montrons ce "Boys_df" sur la console. Nous utilisons la fonction «print ()» ici. Nous n'appliquons pas le dataframe.Méthode LOC encore, donc l'ensemble des données est montré dans la console Sypder.


Lorsque nous appuyons sur le bouton «Shift + Entrée», la sortie que nous obtenons est affichée ici. Toutes les colonnes et les lignes de DataFrame apparaissent dans la sortie alors que nous avons imprimé l'intégralité de DataFrame «Boys_DF» ici. Maintenant, nous appliquons le dataframe.Méthode LOC à ce "Boys_DF" qui suit:


Nous venons de mettre le nom du DataFrame et la méthode LOC comme «Boys_DF.loc. Nous n'accordes qu'une seule valeur à partir du garçons_df. Nous mentionnons la valeur d'index de la ligne et le nom de colonne dont nous voulons obtenir la valeur que nous voulons obtenir. Nous plaçons le «R # 2» qui est la valeur d'index de la ligne et «b_name» comme nom de la colonne. Ainsi, la valeur qui apparaît dans cette cellule est accessible. Nous stockons cette valeur dans «Boy» et imprimons cette valeur sur la console.


La valeur apparaît dans la cellule dont l'indice de ligne est «R # 2». Le nom de la colonne «b_name» s'affiche sur l'écran de la console. Nous obtenons cette valeur «Rishi» à l'aide du «DataFrame.Méthode loc ”.

Exemple 2:

Dans notre deuxième exemple, après avoir importé les méthodes «pandas» comme «PD», nous faisons une dataframe car nous mettons le «PD.Trame de données". Ce dataframe est nommé "Customer_DF". Il contient les colonnes distinctes qui sont "Cust_name, Cust_Location, Product_id et DIC_PER". Ce sont les noms de chaque colonne que nous avons créée dans ce DataFrame. Nous mettons les noms de clients dans la colonne «Cust_name» qui sont «Joseph, Jacob, Edward, Ricona, Ryan, Simon, Nick, Patrick et John». Nous ajoutons l'emplacement de chaque client qui sont «Delhi, Banglore, Pune, Delhi, Baljiam, Birmingham, Mexique, Canada et New York» dans la colonne «Cust_Location».

Vient ensuite la colonne «Product_id» qui contient l'ID des produits comme «B112, B1213, B2214, B1255, B1116, B797, B7620, B3490 et B2912». La dernière colonne que nous avons dans le «Customer_DF» est «dis_per» où nous insérons le pourcentage du prix de réduction qui est »2%, 3%, 10%, 5%, 4%, 1%, 7%, 8%, et 2% ”. Le dataframe est terminé. Nous définissons l'index de ligne en initialisant la variable «index_» avec les valeurs d'index. Ces valeurs vont de «R1 à R9» comme indiqué.

Maintenant, ajoutez ces index au dataframe en plaçant le «client_df.Index »ci-dessous. Après cela, affichez le «client_df». Ces index sont insérés dans ce dataframe. Maintenant, nous devons accéder uniquement à deux colonnes à partir de ce DataFrame. Pour cela, nous utilisons la méthode «LOC» et placez les noms des deux colonnes auxquelles nous voulons accéder à partir de ce «Customer_DF». Les colonnes auxquelles nous accéderons ici sont "Cust_name et dis_per". Stockez ces deux colonnes dans la variable «client». Affichez uniquement les colonnes que nous obtenons en appliquant la méthode «loc».


Il y a quatre colonnes dans le dataframe comme indiqué dans l'illustration suivante. Nous accédons à deux colonnes à partir de ce DataFrame qui est également affichée sous cette dataframe. Nous accédons à ces colonnes à l'aide de la méthode «LOC».

Exemple 3:

Ici, nous faisons la liste imbriquée nommée «Account_holder_list». Il contient le «Ah_country» qui contient le nom du pays. Le «Account_holder» contient les noms des titulaires de compte qui sont «Callahan, Finchley, Farnham, Fuller, Bromley, Coghill et Fuller». Le «Account_No» contient le numéro de compte des titulaires de compte qui sont «253448, 120849, 272450, 234525, 294439 et 201501».

Ensuite, nous ajoutons le «membre depuis» où nous ajoutons le mois et l'année des membres comme «juin 2020, juillet 2021, mai 2022, août 2022, janvier 2022, mai 2022, décembre 2021». Après cela, nous créons la colonne «New_amount» et insérons les montants qui sont «180 $, 260 $, 190 $, 550 $, 450 $, 320 $ et 500 $». Nous ajoutons également l'index en tant que «R_1, R_2, R_3, R_4, R_5, R_6 et R_7». Maintenant, nous convertissons le «compte_holder_list» en «Account_holder_df» en utilisant la méthode Pandas. Ajustez les index de ligne à ce "compte_holder_df".

Nous rendons le "Account_holder_df". Après cela, nous accédons aux lignes en mentionnant la gamme des lignes. Nous voulons obtenir quatre lignes qui vont de "R_2: R_5". Nous plaçons cette gamme dans la méthode «loc». Il accède aux lignes "R_2, R_3, R_4 et R_5". Rendez-les sur la console car nous mettons cette méthode dans la déclaration d'impression.


L'ensemble des données contient les lignes de «R_1» à «R_7». Comme vous pouvez le voir, il n'accorde que quatre lignes sous cette dataframe dont la plage est mentionnée dans la méthode «LOC». Il rend également ces lignes ici dans la console. Identique à celui-ci, nous pouvons également accéder aux colonnes en mentionnant la plage des colonnes dans la méthode «LOC».

Conclusion

Ce guide est écrit pour vous afin que vous apprennez comment fonctionne cette méthode «loc» et comment utiliser cette méthode «loc» en pandas. Nous avons expliqué cette méthode «loc» en détail et nous avons fourni une démonstration pratique de la méthode «LOC» en utilisant cette méthode dans notre code Pandas. Nous avons montré la sortie avec le script de code. Nous avons discuté que la méthode «LOC» nous aide à accéder à la ligne ou à la colonne ou à toute valeur. Nous espérons que ce guide vous est facile d'apprendre et de comprendre car tous les concepts et codes sont expliqués ici.