Pandas à_records

Pandas à_records
Pandas DataFrame est un format de données tabulaires de taille bidimensionnelle hétérogène avec des axes nommés. Pour les opérations mathématiques, les étiquettes de ligne et de colonne doivent toujours être alignées. La structure des données fondamentales des Pandas est comparable à un dict en ce qu'elle agit comme un conteneur pour les éléments de la série.

DataFrame est converti en un tableau d'enregistrement Numpy à l'aide de Pandas DataFrame.à des enregistrements () fonction. L'indice est généralement donné comme le champ initial de l'enregistrement. Nous discuterons de la méthode pandas to_records () avec des exemples dans cet article.

Qu'est-ce qu'un cadre de données?

Pandas est un package de science des données Python populaire pour une raison: il fournit des structures de données puissantes, expressives et flexibles qui facilitent la manipulation et l'analyse des données, entre autres. Le DataFrame est l'une de ces structures.

Une trame de données est une structure de données bidimensionnelle dans laquelle les données sont représentées sous la forme de lignes et de colonnes. Un Pandas DataFrame est composé de trois composants principaux: les données, les lignes et les colonnes.

Parce qu'ils fournissent une manière flexible et facile de stocker et de travailler avec les données, les données de données sont l'une des structures de données les plus souvent utilisées dans l'analyse de données moderne.

Pour créer un Pandas DataFrame, les listes, les séries, les dictions, Numpy Ndarrays et une autre DataFrame peuvent tous être utilisés pour créer un Pandas DataFrame.

Quelle est la syntaxe des pandas.Trame de données.fonctions to_records ()?

La méthode to_records () est de convertir un dataframe en un tableau d'enregistrement Numpy pertinent. La fonction to_records () en pandas a la syntaxe suivante.

# Trame de données.to_records (index = true, column_dtypes = non, index_dtypes = aucun)

Tous les détails sur les paramètres se trouvent dans la section suivante.

Indice

Incluez l'index dans le tableau d'enregistrement résultant, qui peut être stocké dans le champ «Index» ou accessible via l'étiquette d'index, si l'on est défini.

Column_dtypes

Si le type de données est une chaîne ou un type, il sera utilisé pour stocker toutes les colonnes.

Index_dtypes

Si le type de données est une chaîne ou peut-être un type, il sera utilisé pour maintenir tous les niveaux d'index. S'il s'agit d'un dictionnaire, la cartographie des noms de niveau d'index, ainsi que des indices, sont utilisés pour spécifier les types de données. Seulement si index = true est ce mappage utilisé.

Discutons du sujet en profondeur avec différents exemples. Vous pouvez mettre en œuvre ces exemples et voir le concept global d'une meilleure manière.

Exemple 1:

Le dataframe.to_records () Fonction de Python est de modifier le dataframe spécifié en un tableau d'enregistrement Numpy. Considérez le code donné ci-dessous comme exemple.

Nous avons construit une dataframe avec des valeurs pour trois qualités différentes: «salaire, nom d'employé et âge»; 39000, 44000, 25000 et 55000 sont les valeurs du salaire de la propriété.`` Alex, Andrew, Zack et Kim sont parmi les valeurs de l'attribut '' Nom de l'employé.'

De la même manière, l'attribut d'âge comprend les valeurs 39, 44, 25 et 55. L'indice a été construit et défini. Le dataframe est ensuite imprimé.

importer des pandas
d_frame = pandas.DataFrame ('Salaire': [39000, 44000, 25000, 55000],
«Nom des employés»: [«Alex», «Andrew», «Zack», «Kim»],
'Age': [39, 44, 25, 55])
index_ = pandas.Date_range ('2020-08-05 07:30', périodes = 4, freq = 'h')
d_frame.index = index_
print (d_frame)

Le salaire, le nom des employés et les valeurs d'âge, ainsi que la date et l'heure, sont indiqués dans la capture d'écran ci-dessous.

Dans la capture d'écran suivante, le dataframe spécifié à une représentation pertinente du tableau d'enregistrement Numpy est affiché.

importer des pandas
d_frame = pandas.DataFrame ('Salaire': [39000, 44000, 25000, 55000],
«Nom des employés»: [«Alex», «Andrew», «Zack», «Kim»],
'Age': [39, 44, 25, 55])
index_ = pandas.Date_range ('2020-08-05 07:30', périodes = 4, freq = 'h')
d_frame.index = index_
print (d_frame)
résultat = d_frame.to_records ()
imprimer (résultat)

L'image suivante explique que le dataframe.La fonction TO_RECORDS () est utilisée pour modifier le DataFrame en une représentation de tableau d'enregistrement Numpy pertinente.

Exemple 2:

Nous verrons comment utiliser le dataframe.fonction à_records () dans le deuxième exemple. Le code est similaire à celui mentionné ci-dessus. Nous avons d'abord importé le module Pandas, puis généré le dataframe.

L'index a ensuite été formé comme indiqué dans le code: index_ = [«première ligne», «deuxième ligne», «troisième ligne», «quatrième rangée» et «cinquième ligne»]. Enfin, nous avons défini l'index et imprimé les résultats DataFrame. Regardez la dernière ligne du code.

importer des pandas
dta_frame = pandas.DataFrame ("1": [9, 3, 4, aucun, 6],
"2": [8, 1, 22, 35, aucun],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, aucun, 1, 9])
index_ = ['first_row', 'second_row', 'third_row', 'quatrith_row', 'Fifth_Row']
dta_frame.index = index_
print (dta_frame)

Vous pouvez voir le résultat ici, qui comprend l'index et le dataframe.

En utilisant le dataframe.à la fonction enregistrements (), nous avons converti le dataframe donné. Vous pouvez le voir dans la capture d'écran suivante attachée.

importer des pandas
dta_frame = pandas.DataFrame ("1": [9, 3, 4, aucun, 6],
"2": [8, 1, 22, 35, aucun],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, aucun, 1, 9])
index_ = ['first_row', 'second_row', 'third_row', 'quatrith_row', 'Fifth_Row']
dta_frame.index = index_
print (dta_frame)
résultat = dta_frame.to_records ()
imprimer (résultat)

Après avoir apporté des modifications minimales au code de référence ci-dessus, c'est le résultat. Le dataframe.La fonction TO_RECORDS () modifie un dataframe spécifique à une représentation de tableau d'enregistrement Numpy pertinente.

Exemple 3:

Dans notre dernier exemple, nous examinerons comment convertir un Pandas DataFrame en utilisant la technique Numpy - les Pandas. La méthode to_numpy peut être utilisée pour transformer cette structure de données en un tableau Numpy.

Vous pouvez voir dans le code que nous avons importé les modules Pandas et Numpy, qui sont essentiels à l'exécution du code. Nous avons construit le dataframe après l'importation des modules. Il y a 5 lignes et 3 colonnes de données dans le dataframe.

Après cela, le dataframe est transformé en un tableau Numpy. Le dataframe transformé et son type sont affichés.

importer des pandas
Importer Numpy
data_frame = pandas.Trame de données(
données = Numpy.aléatoire.Randint (
0, 10, (5,3)),
colonnes = ["a", "b", "c"])
cls_res = data_frame.to_numpy ()
imprimer (CLS_RES)
print (type (cls_res))

La sortie est dans la capture d'écran suivante. Les valeurs de données dans les 5 lignes et 3 colonnes de DataFrame construites peuvent être vues ici. La classe est également affichée dans la dernière ligne de la sortie. Comme illustré ci-dessus, la méthode Pandas DataFrame to Numpy () transforme un DataFrame en un tableau Numpy.

Conclusion:

La fonction to_record () dans Python est décrite dans cet article. Le Pandas Dataframe est également bien enseigné avec des exemples. Les étapes de conversion d'une dataframe en utilisant la méthode DataFrame to_records () sont également expliquées.