Comment créer des données de données Pandas dans Python?

Comment créer des données de données Pandas dans Python?

Pandas DataFrame est une structure de données annotée 2D (bidimensionnelle) dans laquelle les données sont alignées dans la forme tabulaire avec différentes lignes et colonnes. Pour une compréhension plus facile, le dataframe se comporte comme une feuille de calcul qui contient trois composants différents: index, colonnes et données. Pandas DataFrames est le moyen le plus courant d'utiliser les objets du panda.

Pandas Dataframes peut être créé à l'aide de différentes méthodes. Cet article expliquera toutes les méthodes possibles par lesquelles vous pouvez créer Pandas DataFrame dans Python. Nous avons exécuté tous les exemples sur l'outil PyCharm. Commençons la mise en œuvre de chaque méthode une par une.

Syntaxe de base

Suivez la syntaxe suivante lors de la création de DataFrames dans Pandas Python:

PD.DataFrame (DF_DATA)

Exemple: Expliquer avec un exemple. Dans ce cas, nous avons stocké les données des noms et pourcentages des étudiants dans une variable «Students_data». De plus, en utilisant le PD.DataFrame (), nous avons créé un DataFrames pour afficher le résultat de l'élève.

Importer des pandas en tant que PD
Students_data =
«Nom»: [«Samreena», «asif», «Mahwish», «Raees»],
«Pourcentage»: [90,80,70,85]
Résultat = PD.DataFrame (Students_data)
Imprimer (résultat)

Méthodes pour créer des pandas dataframes

Pandas Dataframes peut être créé en utilisant les différentes façons dont nous discuterons dans le reste de l'article. Nous allons imprimer les cours de l'étudiant entraîner la forme de dataframes. Ainsi, en utilisant l'une des méthodes suivantes, vous pouvez créer des frames de données similaires qui sont représentés dans l'image suivante:

Méthode n ° 01: Création de Pandas DataFrame à partir du dictionnaire des listes

Dans l'exemple suivant, les dataframes sont créés à partir des dictionnaires des listes liées aux résultats du cours de l'étudiant. Tout d'abord, importez une bibliothèque de panda, puis créez un dictionnaire de listes. Les clés du dict représentent les noms de colonne tels que «Student_name», «Course_Title» et «GPA». Les listes représentent les données ou le contenu de la colonne. La variable 'Dictionary_lists' contient les données des étudiants qui sont affectées à la variable 'DF1'. À l'aide de l'instruction PRINT, imprimez le contenu de DataFrames.

Exemple:

# Importer des bibliothèques pour pandas et Numpy
Importer des pandas en tant que PD
# Importer la bibliothèque de Panda
Importer des pandas en tant que PD
# Créer un dictionnaire de la liste
dictionary_lists =
'Student_name': ['Samreena', 'Raees', 'Sara', 'Sana'],
«Course_Title»: [«SQA», «Sre», «It Basics», «Artificiel Intelligence»],
'GPA': [3.1, 3.3, 2.8, 4.0]
# Créer le DataFrame
dframe = pd.DataFrame (Dictionary_lists)
Imprimer (DFrame)

Après avoir exécuté le code ci-dessus, la sortie suivante sera affichée:

Méthode n ° 02: Créez des données Pandas à partir du Dictionary of Numpy Array

Le DataFrame peut être créé à partir du dict de la table / liste. À cette fin, la longueur doit être la même que toute la narration. Si un index est passé, la longueur d'index doit être égale à la longueur du tableau. Si aucun index n'est passé, alors, dans ce cas, l'index par défaut est une plage (n). Ici, n représente la longueur du tableau.

Exemple:

Importer Numpy comme NP
# Créer un tableau nuchy
nparray = np.déployer(
[[«Samreena», «Raees», «Sara», «Sana»],
[«SQA», «sre», «It Basics», «Intelligence artificielle»],
[3.1, 3.3, 2.8, 4.0]])
# Créer un dictionnaire de nparray
dictionary_of_nparray =
'Student_name': npArray [0],
'Course_Title': npArray [1],
'Gpa': nparray [2]
# Créer le DataFrame
dframe = pd.DataFrame (dictionary_of_nparray)
Imprimer (DFrame)

Méthode n ° 03: Création de Pandas DataFrame à l'aide de la liste des listes

Dans le code suivant, chaque ligne représente une seule ligne.

Exemple:

# Importer la bibliothèque Pandas PD
Importer des pandas en tant que PD
# Créer une liste de listes
group_lists = [
['Samreena', 'sqa', 3.1],
[«Raes», «sre», 3.3],
['Sara', 'It Basics', 2.8],
[«Sana», «Intelligence artificielle», 4.0]]
# Créer le DataFrame
dframe = pd.DataFrame (Group_lists, Columns = ['Student_name', 'Course_Title', 'GPA'])
Imprimer (DFrame)

Méthode n ° 04: Création de Pandas DataFrame à l'aide de la liste du dictionnaire

Dans le code suivant, chaque dictionnaire représente une seule ligne et des clés qui représentent les noms de colonne.

Exemple:

# Importer la bibliothèque Pandas
Importer des pandas en tant que PD
# Créer une liste de dictionnaires
dict_list = [
'Student_name': 'Samreena', 'Course_Title': 'SQA', 'GPA': 3.1,
'Étudiant_name': 'raees', 'Course_title': 'sre', 'gpa': 3.3,
'Student_name': 'Sara', 'Course_Title': 'It Basics', 'GPA': 2.8,
'Student_name': 'Sana', 'Course_Title': 'Artificial Intelligence', 'GPA': 4.0]
# Créer le DataFrame
dframe = pd.Dataframe (dict_list)
Imprimer (DFrame)

Méthode n ° 05: Création de Pandas DataFrame à partir de la série Pandas

Les clés du dict représentent les noms des colonnes et chaque série représente le contenu des colonnes. Dans les lignes de code suivantes, nous avons pris trois types de séries: name_series, cours_series et gpa_series.

Exemple:

# Importer la bibliothèque Pandas
Importer des pandas en tant que PD
# Créez la série de noms d'étudiants
Name_series = pd.Série (['samreena', 'raees', 'Sara', 'Sana'])
Course_Series = PD.Série ([«SQA», «SRE», «It Basics», «Intelligence artificielle»])
Gpa_series = pd.Série ([3.1, 3.3, 2.8, 4.0])
# Créer un dictionnaire série
dictionary_of_nparray
\
'] = ' Name ': name_series,' age ': cours_series,' département ': gpa_series
# Création de dataframe
dframe = pd.DataFrame (dictionary_of_nparray)
Imprimer (DFrame)

Méthode n ° 06: Créez des données Pandas à l'aide de la fonction zip ().

Différentes listes peuvent être fusionnées via la fonction de liste (zip ()). Dans l'exemple suivant, Pandas DataFrame est créé en appelant PD.Fonction DataFrame (). Trois listes différentes sont créées qui sont fusionnées sous la forme de tuples.

Exemple:

Importer des pandas en tant que PD
# List1
Student_name = ['Samreena', 'Raees', 'Sara', 'Sana']
# List2
Course_Title = [«SQA», «SRE», «It Basics», «Artificiel Intelligence»]
# List3
Gpa = [3.1, 3.3, 2.8, 4.0]
# Prenez la liste des tuples de trois listes plus loin, fusionnez-les par l'utilisation de zip ().
tuples = list (zip (étudiant_name, cours_title, gpa))
# Attribuer des valeurs de données aux tuples.
tuples
# Convertir la liste des tuples en pandas dataframe.
dframe = pd.DataFrame (Tuples, Columns = ['Student_name', 'Course_Title', 'GPA'])
# Imprimer les données.
Imprimer (DFrame)

Conclusion

En utilisant les méthodes ci-dessus, vous pouvez créer des Pandas DataFrames dans Python. Nous avons imprimé le cours d'un étudiant GPA en créant des pandas dataframes. J'espère que vous obtiendrez des résultats utiles après avoir exécuté les exemples mentionnés ci-dessus. Tous les programmes sont bien commentés pour une meilleure compréhension. Si vous avez plus de moyens de créer des Pandas Dataframes, n'hésitez pas à les partager avec nous. Merci d'avoir lu ce tutoriel.