Dans ce court article, nous discuterons de la façon de calculer la différence entre deux dates dans Pandas.
Différence entre deux dates en jours
Nous pouvons utiliser l'objet TimeDelta pour calculer la différence entre deux dates dans Pandas.
Un exemple est indiqué ci-dessous:
1 2 3 | Importer des pandas en tant que PD date_1 = pd.to_datetime ('2022-01-01') date_2 = pd.to_datetime ('1990-01-01') |
Dans l'exemple ci-dessus, nous avons deux objets DateTime. Pour calculer la différence entre les deux jours de jours, nous pouvons faire ce qui suit:
1 2 | diff = pd.TimeDelta (date_1 - date_2).jours print (f "diff jours") |
Le code ci-dessus calcule la différence entre les deux dates et renvoie le résultat en jours comme indiqué:
1 | 11688 jours |
Différence en mois
Pour obtenir la différence en mois, nous pouvons simplement diviser le résultat en 12 comme indiqué:
1 2 | diff = pd.TimeDelta (date_1 - date_2).jours / 12 print (f "diff mois") |
Cela devrait revenir:
1 | 974.0 mois |
Une autre méthode que nous pouvons utiliser pour déterminer la différence entre deux dates est la fonction TIMEDETLA64 dans Numpy.
Un exemple est indiqué ci-dessous:
1 2 3 4 5 | Importer Numpy comme NP date_1 = pd.to_datetime ('2022-01-01 13:00:22') date_2 = pd.to_datetime ('1990-01-01 00:00:00') diff = date_1 - date_2 diff / np.Timedelta64 (1, «D») |
Dans l'exemple ci-dessus, nous commençons par importer Numpy. Ensuite, nous avons deux objets d'horodatage pandas.
Nous soustrayons les variables et utilisons la fonction TimeDelta64 pour convertir la valeur en jours pour calculer la différence.
Le code ci-dessus doit retourner:
1 | 11688.541921296297 |
Pour convertir la valeur en années, modifiez le deuxième paramètre de «D» en «y» comme indiqué:
1 | 32.00214082779604 |
Conclusion
Cet article donne deux exemples de la façon dont vous pouvez calculer la différence entre deux dates à l'aide de pandas et de Numpy.