La méthode la plus courante et la plus populaire pour convertir le DataFrame en un tableau est l'utilisation de la fonction TO_NUMPY (). Dans Numpy, les dimensions sont appelées l'axe. Le «tableau.La classe du tableau »de la bibliothèque Python par défaut est distincte du Numpy.déployer. Nous avons également l'attribut «valeurs» et les méthodes à_records ().
Méthode 1: Utilisation de TO_Numpy ()
Lorsque nous appliquons la méthode TO_NUMPY () sur Pandas DataFrame, un objet du type de données Numpy, NDArray est renvoyé en sortie. En règle générale, un ndarray bidimensionnel est retourné. Jetons un coup d'œil à la syntaxe de la fonction avant de voir le fonctionnement de la fonction dans les exemples suivants.
Syntaxe:
Dataframe_object.to_numpy (dType = aucun, copy = false, na_value = nodefault.aucun défaut)
Paramètres:
- dtype: Numpy.dtype, str ou facultatif. Le type de données est passé à Numpy.AsArray ().
- copie: Bool, faux par défaut. Si vous devez vérifier que les données / valeur renvoyés ne sont pas une vue sur les autres tableaux. Le to_numpy () n'est pas garanti d'être sans copie lorsque la copie = false est utilisée. Au lieu de cela, Copy = True fait une copie même si elle n'est pas strictement nécessaire.
- na_value: Toute option. La valeur à remplacer s'il y a des valeurs manquantes. La valeur, par défaut, dépend des dtypes des colonnes dans le dataframe.
Exemple 1:
Ayons un dataframe ayant 5 lignes et 3 colonnes et convertissez-la en un tableau Numpy en utilisant la méthode to_numpy ().
importer des pandas
Importer Numpy
# Considérez le Pandas DataFrame
réel = pandas.DataFrame ([[1, "Cuisine", 200],
[2, "musique", 3004],
[3, "Mand à tisser", 1000],
[4, "Mand Loom", 2000],
[5, "s'habiller", 3000]],
colonnes = ['id', 'work', 'salaires'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Affichez le dataframe converti
imprimer (réel, "\ n")
# Convertir en tableau Numpy
converti = réel.to_numpy ()
# Affichez le type de tableau Numpy
imprimer (type (converti), "\ n")
Imprimer (converti)
Sortir:
Explication:
Après avoir converti au tableau Numpy, nous utilisons la fonction type () pour afficher le type de tableau converti. Vous pouvez voir que 5 lignes sont stockées dans un tableau nu.
Exemple 2:
Convertir uniquement deux colonnes dans le dataframe en tableau Numpy à l'aide de la méthode TO_NUMPY (). Ici, nous devons spécifier les noms de colonne à convertir en tableau Numpy dans une liste.
importer des pandas
Importer Numpy
# Considérez le Pandas DataFrame
réel = pandas.DataFrame ([[1, "Cuisine", 200],
[2, "musique", 3004],
[3, "Mand à tisser", 1000],
[4, "Mand Loom", 2000],
[5, "s'habiller", 3000]],
colonnes = ['id', 'work', 'salaires'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Convertir uniquement les colonnes «travail» et «salaires» en tableau Numpy
imprimer (réel [['work', 'salaires']].to_numpy ())
Sortir:
Explication:
Nous pouvons voir que seules deux colonnes [«travail», «salaires»] sont converties en un tableau nu.
Méthode 2: Utilisation de l'attribut de valeurs
Les «valeurs» sont un attribut qui convertit directement le Pandas Dataframe au tableau Numpy.
Syntaxe:
Dataframe_object.valeurs
Exemple 1: Convertissez l'intégralité de DataFrame en tableau Numpy
Considérez le DataFrame précédent et convertissez-le en un tableau Numpy à l'aide de la méthode TO_NUMPY ().
importer des pandas
Importer Numpy
# Considérez le Pandas DataFrame
réel = pandas.DataFrame ([[1, "Cuisine", 200],
[2, "musique", 3004],
[3, "Mand à tisser", 1000],
[4, "Mand Loom", 2000],
[5, "s'habiller", 3000]],
colonnes = ['id', 'work', 'salaires'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Utiliser l'attribut de valeurs pour convertir la dataframe ci-dessus en tableau Numpy.
imprimer (réel.valeurs)
Imprimer (Type (réel.valeurs))
Sortir:
Explication:
Vous pouvez voir toutes les colonnes dans le DataFrame au tableau Numpy.
Exemple 2: convertir certaines colonnes en tableau Numpy
Convertir uniquement deux colonnes dans le dataframe en tableau Numpy à l'aide de la méthode TO_NUMPY (). Ici, nous devons spécifier les noms de colonne à convertir en tableau Numpy dans une liste.
importer des pandas
Importer Numpy
# Considérez le Pandas DataFrame
réel = pandas.DataFrame ([[1, "Cuisine", 200],
[2, "musique", 3004],
[3, "Mand à tisser", 1000],
[4, "Mand Loom", 2000],
[5, "s'habiller", 3000]],
colonnes = ['id', 'work', 'salaires'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
imprimer (réel [['work', 'salaires']].valeurs)
Sortir:
Nous pouvons voir que seules deux colonnes [«travail», «salaires»] sont converties en un tableau nu.
Méthode 3: Utilisation du to_records ()
Le «to_records ()» convertit directement le dataframe existant en un tableau Numpy qui est de type de tableau d'enregistrement. L'avantage de l'utilisation de cette méthode est que pour chaque ligne convertie, l'index est également disponible dans le tableau d'enregistrement.
Syntaxe:
Dataframe_object.to_records ()
Exemple 1: Convertissez l'intégralité de DataFrame en tableau Numpy
Considérez le DataFrame précédent et convertissez-le en un tableau Numpy à l'aide de la méthode TO_RECORDS ().
importer des pandas
Importer Numpy
# Considérez le Pandas DataFrame
réel = pandas.DataFrame ([[1, "Cuisine", 200],
[2, "musique", 3004],
[3, "Mand à tisser", 1000],
[4, "Mand Loom", 2000],
[5, "s'habiller", 3000]],
colonnes = ['id', 'work', 'salaires'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Utiliser TO_Records () pour convertir le DataFrame ci-dessus en tableau Numpy.
imprimer (réel.to_records (), "\ n")
# Obtenez le type de données
Imprimer (Type (réel.to_records ()))
Sortir:
Explication:
Vous pouvez voir toutes les colonnes dans le dataframe au tableau Numpy et le tableau renvoyé est un tableau d'enregistrement. Dans chaque enregistrement, vous pouvez également voir l'index.
Exemple 2: convertir certaines colonnes en tableau Numpy
Utilisez la méthode to_records () pour convertir les 2 premières colonnes de DataFrame en un tableau Numpy.
importer des pandas
Importer Numpy
# Considérez le Pandas DataFrame
réel = pandas.DataFrame ([[1, "Cuisine", 200],
[2, "musique", 3004],
[3, "Mand à tisser", 1000],
[4, "Mand Loom", 2000],
[5, "s'habiller", 3000]],
colonnes = ['id', 'work', 'salaires'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Utiliser TO_Records () pour convertir les 2 premières colonnes dans le DataFrame en un tableau Numpy.
print (réel [['id', 'work']].to_records (), "\ n")
Sortir:
Les deux premières colonnes sont converties en tableau Numpy.
Conclusion
Nous avons discuté de ce que sont les tableaux et comment les dataframes dans les pandas peuvent être convertis en colonnes Numpy. Nous avons utilisé trois méthodes pour transformer les colonnes DataFrame en un tableau. Dans les exemples de cet article, nous avons essayé de vous apprendre à convertir les colonnes spécifiques ou l'ensemble des données de données en un tableau Numpy en utilisant la fonction TO_NUMPY (). Nous avons également utilisé la méthode des valeurs Attribut et TO_RECORDS () pour convertir les colonnes DataFrame en un tableau Numpy.