Pandas à ce jour

Pandas à ce jour
«Dans cet article, vous apprendrez à convertir une colonne DataFrame à ce jour et l'heure à l'aide de la fonction Pandas en DateTime. Traiter les dates dans Pandas est très polyvalent en raison des nombreuses fonctions et méthodes fournies par Pandas. Les données ne sont pas toujours lues avec précision, cependant."

Après avoir terminé ce tutoriel, vous saurez:

  • Comment modifier une colonne de DataFrame à ce jour l'heure à l'aide de la fonction Pandas à DateTime.
  • Comment spécifier le format de date pour modifier divers formats de chaîne.
  • Convertir les secondes et les dates en entiers en Pandas Datetime.

Cet article vous apprendra à formater une colonne de chaîne comme date, à formater plusieurs colonnes de chaîne comme dates, et enfin formater toutes les colonnes de chaîne contenant des dattes en tant que colonnes DateTime.

Comment convertir ou modifier les colonnes de dataframe en DateTime dans Pandas?

Dans ce tutoriel, nous utiliserons la fonction to_datetime (). Tout d'abord, examinons la méthode pandas to_datetime (), qui prend une série ou une colonne Pandas et la convertit en une datetime. La fonction offre une large gamme de paramètres flexibles qui vous permettent de modifier les résultats.

Syntaxe: pandas.to_datetime (arg, errors = 'relance', dayFirst = false, cerefirst = false, utc = non, box = true, format = non, exact = true, unit = non, infér_datetime_format = false, origin = 'unix', cache = FAUX)

Paramètres

arg: Un objet flottant, chaîne, liste ou dictionnaire entier à convertir en un objet DateTime.

jour de jour: Une valeur bool. C'est vrai par défaut.

Année: Valeur booléenne. Si c'est vrai, l'année sera placée en premier.

UTC: Valeur booléenne, si elle est définie sur true, il renvoie le temps dans UTC.

format: La position du jour, du mois et de l'année est indiquée par une entrée de chaîne.

Type de retour: Série DateTime.

Exemple n ° 1: Convertir une colonne de chaîne en datetime

Nous allons d'abord créer un dataframe à l'aide d'un dictionnaire pour démontrer cet exemple. Ici, nous allons créer un dictionnaire. Nous importons d'abord des pandas, puis nous passons le dictionnaire comme argument à l'intérieur du PD.Classe DataFrame.

Nous avons créé notre dataframe. Le DataFrame se compose de quatre colonnes «id», «nom», «salaire» et joint_date. La colonne ID est de stockage des valeurs de chaîne (1001, 1002, 1003, 1004, 1005, 1006), tandis que les colonnes «nom» et «salaire» contiennent les valeurs («kiara», «sam», «cara», «brian» »,« Henry »,« Bill ») et (12000, 10000, 9000, 9900, 11500, 11000). Dans la colonne «Joining_Date», nous avons stocké les valeurs de date en tant que données de chaîne («1/5/2019», «3/10/2019», «3/10/2019», «5/2/2021», «4 / 4/2021 ”,« 10/4/2021 »).

Maintenant, pour modifier la colonne «joining_date» dans DateTime, nous appliquerons la méthode to_datetime ().

Nous avons passé la colonne Joining_Date à la fonction to_datetime (). Vérinons maintenant si la colonne est convertie en DateTime ou non en utilisant la fonction info () sur notre DataFrame.

Dans la section / colonne DType, vous pouvez voir que la colonne Joining_Date est convertie en DateTime.

Exemple n ° 2: convertir une colonne numérique en datetime

Nous avons vu dans l'exemple n ° 1 comment convertir une colonne avec des valeurs de date en tant que chaîne en un datatime. Maintenant, nous allons créer un dataframe avec au moins une colonne ayant des valeurs de date en tant que chaîne, puis nous la convertirons en datetime à l'aide de la fonction to_datetime ().

Nous avons créé notre DataFrame avec quatre colonnes «ID», «Nom», «Age» et «Task_Date». Les valeurs de données (1011, 1022, 1033, 1044, 1055, 1066), («Tom», «Mandy», «Sara», «Bran», «Lucy», «Blake») et (24, 21, 23 , 25, 21, 23) sont stockés dans les colonnes «Id», «Nom» et «Age» respectivement. Dans la colonne «Task_Date», nous avons stocké les données de date sous forme de valeurs numériques (20220410, 20220412, 20220415, 20220501, 20220515, 20220610). Encore une fois, nous utiliserons l'attribut dTypes pour déterminer les données de chaque colonne dans notre dataframe.

Actuellement, le type de données de la colonne «Task_Date» est int64. Pour le convertir en DateTime, nous utiliserons la méthode TO_DATEtime ().

Nous avons converti la colonne entière en DateTime en utilisant la fonction to_datetime (). La méthode info () peut être utilisée pour vérifier le résultat.

Au lieu de stocker la DateTime dans la même colonne, nous pouvons stocker les valeurs DateTime dans une nouvelle colonne.

Le type de données de la nouvelle colonne DateTime peut être déterminé à l'aide de l'attribut DTYPES.

Exemple n ° 3: Convertissez la colonne de chaîne en DateTime avec le format YyyyMMDD

Nous pouvons modifier le format de date des valeurs de chaîne de date après avoir converti les valeurs en DateTime à l'aide de la fonction to_datetime () et spécifiant le paramètre de format comme format valide. Nous allons d'abord créer une dataframe composée d'au moins une colonne avec des valeurs de date sous forme de chaînes.

Dans le DataFrame ci-dessus, nous avons créé deux colonnes «Sales» et «Sales_Date» avec des valeurs de données (3, 2, 4, 10, 5, 6) et («220110», «210215», «210330», «210401» , «210510», «210620»). Actuellement, le type de données de la colonne «Sales_date» sera «Objet».

Vous pouvez voir que la colonne «Date de vente» dans le DataFrame a le type de données «objet», indiquant qu'il s'agit d'une chaîne. Maintenant, nous utiliserons le paramètre de format de la méthode to_datetime () pour convertir le format de données au format DateTime («Yyyy-mm-dd»).

On peut voir que notre colonne Sales_date est convertie en datetime et formatée au format% y% m% d.

Exemple n ° 4: Convertir les multiples colonnes en DateTime

Vous pouvez utiliser les méthodes pandas appliquer () et to_datetime () pour convertir plusieurs colonnes en pandas en datetime. La fonction applique () sera appliquée à une liste avec des étiquettes de colonnes, et la fonction to_datetime () sera transmise comme entrée dans la fonction appliquer (). Tout d'abord, nous avons besoin d'un dataframe avec plusieurs colonnes contenant les données de date.

Nous avons créé le DataFrame requis avec les colonnes «Tâche», «Assign_Date» et «Due_Date». Dans la colonne «tâche», nous avons des valeurs de données (2, 4, 5, 2, 4, 3), dans la colonne «Assign_date», nous avons stocké les valeurs de chaîne («13/02/2022», «3/03 / 2019 ”,« 5/04/2019 »,« 7/05/2021 »,« 10/06/2021 »,« 12/07/2021 »), et dans la colonne« Due_Date », les valeurs de données sont (« « 18/02/2022 ”,« 10/03/2022 »,« 8/04/2022 »,« 12/05/2022 »,« 15/06/2022 »,« 21/07/2022). Maintenant, convertissons les colonnes de date en datetime.

Nous avons sélectionné les colonnes «Attribute_Date» et «Due_Date», puis appliqués la fonction Appliquer () pour appliquer la fonction TO_DATETime () sur les deux colonnes. Vérifions les digues des colonnes pour vérifier si les colonnes sont converties en datetime.

Les deux colonnes sont converties avec succès en datetime, comme on peut le voir ci-dessus dans la colonne DType.

Exemple n ° 5: Convertir les jours INTEGER UNIX en DateTime

La conversion des données entières en jours Unix est une autre conversion puissante offerte par Pandas. Une colonne entière peut être entrée dans la fonction to_datetime (). Pour ce faire, nous devons spécifier «D» comme valeur du paramètre UNIX, ce qui fait que la valeur entière représente une journée à partir d'une origine donnée. Créons un dataframe ayant une colonne entière représentant les données de date.

Nous avons créé un dataframe ayant une seule colonne, «Date», stockant les valeurs de données comme entiers (12642, 23345, 25322, 14536, 13455). Converons maintenant notre colonne en DateTime.

En spécifiant la fonction UNIX = «D» à l'intérieur de la fonction TO_DATEtime (), nous avons converti les jours Unix (entier) à DateTime. Nous n'avons pas spécifié le paramètre d'origine car il est défini par défaut sur «Unix».

D'autres méthodes comme Astypes () peuvent également être utilisées pour convertir la colonne du DataFrame en DateTime. Mais l'utilisation de la méthode to_datetime () est un moyen meilleur et plus authentique pour effectuer cette conversion.

Conclusion

Dans ce tutoriel, nous avons discuté de la façon dont la colonne ou la série Pandas peut être convertie dans l'objet Datatime. Nous avons utilisé la fonction TO_DATEtime dans ce tutoriel pour effectuer la conversion de Pandas à DateTime. Nous avons vu la syntaxe de la fonction ainsi que ses paramètres pour comprendre son fonctionnement et sa fonctionnalité. Dans les exemples de cet article, nous avons essayé de vous apprendre à convertir une colonne de chaîne, une colonne numérique et plusieurs colonnes en datetime. Nous avons également discuté des méthodes et des paramètres pour modifier les formats de date.