«Un framework Python pour travailler avec les cadres de données est appelé pandas. Il peut être utilisé à diverses fins, notamment la lecture, l'exportation de fichiers CSV et la conversion des tableaux Numpy en DataFrames. Trois paramètres constituent le Pandas Dataframe. DataFrames est très utile car ils offrent un moyen simple d'imprimer une vue de table, puis de les modifier au besoin. Vous devrez peut-être établir une nouvelle trame de données et ajouter des lignes sélectivement lorsque vous utilisez le DataFrame pour l'analyse des données pour générer un cadre de données avec des enregistrements particuliers.
Sauf si vous attribuez des noms à chaque ligne, l'index sera l'entier commençant à zéro pour la ligne associée. De plus, il est simple de se référer à une colonne par son nom, telles que «données» ou par son emplacement dans le dataframe."
Pandas ajoutant une ligne
Utilisez la fonction loc [] pour ajouter n'importe quelle ligne ou sa colonne pertinente à un dataframe. La fonction insert () ou se comportant comme si vous ajoutiez une tranche de dataframe et plaçant le nom de la colonne entre crochets "[]" sont les deux façons supplémentaires d'ajouter des lignes et des colonnes. Une ligne ne peut être ajoutée qu'au bas d'un dataframe à l'aide de la fonction «loc []» pour l'ajouter au dataframe. Les informations de cette ligne seront remplacées par les données que vous insérez si vous spécifiez un autre index dans le DataFrame. La méthode «APPEND ()» passe le nouveau DataFrame dans le «[]» et applique l'opérateur DOT avec l'ancien DataFrame Data. Au point final de la ligne pertinente, il ajoutera une nouvelle ligne.
Vous devez être conscient des colonnes existantes dans le cadre de données pour ajouter une nouvelle ligne. Il existe quatre façons d'ajouter des lignes au dataframe «A SPEND ()», «Concat ()», «Iloc []» et «.loc [] ". Nous avons utilisé deux techniques dans nos exemples.
La syntaxe pour pandas insérant la ligne par .Méthode loc []
La syntaxe pour ajouter une ligne à l'aide du ".La méthode loc [] »est comme ci-dessus
La méthode Syntaxe for Pandas Inserting Row par A SPEND ()
Exemple 1: Ajout de ligne en utilisant .Méthode loc []
En commençant par le premier exemple, nous ajoutons une ligne unique à notre trame de données en utilisant le «DF.Méthode loc () ”. Lorsqu'une ligne est insérée dans un Pandas DataFrame, elle est ajoutée à la fin du DataFrame tandis que les lignes d'origine restent stables. Utiliser «DataFrame.loc [] »Nous pouvons insérer la ligne à la fin de notre DataFrame. Les exemples incluent l'insertion d'une liste de python «voitures» comme une ligne dans un pandas dataframe, qui ajoute efficacement une ligne au dataframe avec le contenu fourni par une liste.
Dans cet exemple, nous avons construit des cadres de données appelées «voitures». Il y a trois colonnes que le «nom» est le titre de la première colonne. Dans la liste des colonnes «Nom», nous avons les noms de certaines voitures, «Ford», «Honda» et «Toyota». Le prix est la deuxième colonne que nous avons, et il contient les valeurs «3000000», «420000» et «400000» La troisième colonne que nous avons est «modèle», et il contient les valeurs «2021», «2018» et «2019». Maintenant, nous allons afficher notre trame de données à l'aide de «Affichage (DF)».
Le cadre de données comportera désormais une nouvelle colonne en utilisant le «DF.Fonction loc () ”. En utilisant «df.loc () ”, nous ajoutons simplement une seule ligne. La liste que nous avons incluse dans notre dernière rangée est «Volkswagen», «250000» et «2010». Maintenant, il est simple d'ajouter ces valeurs à la dernière ligne de notre DataFrame. Pour comprendre où placer la nouvelle ligne, nous pouvons utiliser «Len (DF.index ») pour trouver le nombre de lignes. L'index, qui se comporte comme une adresse, peut être utilisé pour récupérer n'importe quel point de données dans le cadre de données ou la série. Les lignes et les colonnes ont des index que les index «lignes» sont connues comme telles, tandis que les index «colonnes» sont appelés noms de colonnes générales. Enfin, «Affichage (DF)» affichera une nouvelle trame de données avec une nouvelle ligne.
En appuyant sur le bouton «Exécuter le fichier» de l'interface de l'outil «Spyder» ou en appuyant sur «Shift + Entrée», vous pouvez exécuter le programme Python indiqué ci-dessus. L'interface Spyder affichera ensuite deux dataframes avec trois colonnes en conséquence. Dans ce programme, nous générons d'abord un dataframe avec trois colonnes, «nom», «prix» et «modèle», ayant certaines valeurs en utilisant «PD.DataFrame "et affichant cela sur les écrans en utilisant" Affichage (DF) "Après cela, nous avons ajouté une nouvelle" ligne "dans DataFrame contenant avec la liste" Volkswagen "," 250000 "et" 2010 ".
Une nouvelle «ligne» sera ajoutée en utilisant le «DF.fonction loc () ”, et le« len (df.index) ”s'affiche où la ligne serait placée dans le dataframe. La sortie a maintenant clairement affiché le dataframe avec une nouvelle ligne.
Exemple 2: Ajout de ligne à l'aide de la méthode annexée ()
La fonction annexe () ajoute des lignes d'une autre dataframe à l'abandon de celle qui a été fournie, renvoyant un nouvel objet DataFrame dans le processus. Les colonnes manquantes authentiques sont introduites comme de nouvelles colonnes, et les nouvelles cellules sont remplies de valeurs NAN. Le DataFrame d'origine est resté inchangé, seul un nouvel objet DataFrame est renvoyé par la méthode «APPEND ()».
Cet échantillon déterminera comment utiliser le «DF.Méthode A SPEND () ”pour insérer une nouvelle ligne dans un DataFrame. La première étape consiste à construire une dataframe avec deux colonnes. Le nom de Notre DataFrame, dans cet exemple, est «Données», et la colonne que nous avons choisie parmi elle est «Country» et «Capital». Une liste de valeurs est conservée dans ces colonnes. Dans la première colonne «Country», nous avons «l'Angleterre», «Australie» et «Turquie» et dans la deuxième colonne «capitale», nous avons la liste de leurs pays de la capitale dans lesquels nous avons «Londres», «Canberra» et «Istanbul ".
Nous ajoutons maintenant une nouvelle «ligne» à notre cadre de données en utilisant le «DF.Méthode annexée () ». Les valeurs nouvellement ajoutées pour une ligne sont «Country: Pakistan» et «Capital: Islamabad» Cela indique que «Pakistan» sera imprimé comme dans la colonne «Country» et «Islamabad» est imprimé comme dans la colonne «Capital» ». Utilisez «ignore_ index = true» pour confirmer que votre index est propre. «Ignore_index = true» signifie que les index d'origine, dans ce cas, sont ignorés et remplacés par «0», «1», «2» et «3». Un élément de données sera ajouté en utilisant la méthode Pandas «A SPEND ()» à une autre dataframe. Cela implique de combiner «d1» et «d2» pour obtenir «d1 + d2». Ceci est comparable à un «annexe» de Python standard. Maintenant, en utilisant "Print (DF)". Nous allons maintenant afficher notre trame de données à l'aide de «Print (DF)».
Les deux dataframes sont affichés dans cette image de sortie. Nous avons les colonnes «pays» et «capital» dans le cadre de données. Il comprend une liste de certaines données. Ensuite, nous pouvons voir que l'image de sortie affiche ce cadre de données affiché à l'intérieur. Nous avons élargi la trame de données en ajoutant une nouvelle ligne en utilisant la technique «APPEND ()». Nous pouvons voir que notre nouvelle ligne a été générée dans le cadre de données et est montrée dans l'image avec un «index» de 0 à 3.
Conclusion
Une dataframe peut parfois nécessiter en outre l'ajout de nouvelles lignes. Dans cet article, des méthodologies sont utilisées pour ajouter des lignes à un dataframe. Si nous avons un œil au premier exemple, un cadre de données a été fabriqué en utilisant «PD.trame de données". Trois colonnes constituent ce cadre de données, qui est intitulé «voiture». Nous utilisons le ".LOC [] ”Fonction pour ajouter une ligne à ce DataFrame, et" Print (DF) "est utilisé pour afficher le dataframe à l'écran. De la même manière, nous avons utilisé la méthode «APPEND ()» pour ajouter une ligne à DataFrame dans notre deuxième exemple. Ces deux techniques sont utiles pour ajouter des lignes à un dataframe.