Terrain de séries chronologiques de Seaborn

Terrain de séries chronologiques de Seaborn

Les séries chronologiques sont un type de données dans lesquelles nous voyons un ensemble de mesures sur une période. Chaque observation a son horodatage. Les cours des actions, les lectures des capteurs, les données observées par le programme et d'autres types de données sont des exemples de ce type de données. Dans ce tutoriel, nous utiliserons le module SeaBorn et Pandas pour tracer l'analyse des séries chronologiques à Python. Avant de construire un complot de série temporelle, examinons quelques concepts.

Un tracé de temps (également connu sous le nom de graphique statistique) montre des valeurs à mesure qu'ils changent dans le temps. Ils sont comme des graphiques X-Y. Cependant, les parcelles temporelles ne peuvent représenter que du temps sur l'axe X. Tandis que les graphiques X-Y peuvent tracer diverses variables «x», telles que la taille, le poids et l'âge. Ces parcelles n'incluent pas les catégories, contrairement aux graphiques à tarte et aux graphiques à barres. Les parcelles temporelles sont utiles pour afficher la progression des données à travers le temps. Par exemple, ce type de graphique pourrait être utile si vous analysiez les données à des intervalles impairs.

Supposons que nous complotons des parcelles de temps avec le module Panda. Pandas est une bibliothèque open-source basée sur Numpy. Un module Python fournit de nombreuses structures et méthodes de données pour le traitement des données numériques et statistiques. Il est plus connu pour rendre l'importation et l'analyse des données beaucoup plus simples. Pandas est rapide, très performant et convivial.

Exemple 1: Création d'un tracé de séries chronologiques simple à l'aide d'un tracé de ligne

Nous avons utilisé des modules Python pour construire les graphiques chronologiques. Ces modules comprennent les modules Seaborn, Pandas et Matplotlib. Après avoir ajouté ces modules, nous avons créé des données en appelant la fonction de trame de données du panda et inséré la «date» du champ pour l'axe des x et trois champs supplémentaires pour l'axe y. Le champ Date a des données de séries chronologiques, et d'autres champs ont juste des listes de nombres aléatoires.

Ensuite, nous avons une fonction de tracé de la ligne Seaborn où les paramètres variables x et y sont définis et passent l'ensemble du cadre de données à l'intérieur, qui est stocké à l'intérieur d'une variable «DF». Ce tracé de ligne crée un tracé de séries chronologiques, et nous avons défini l'emplacement de Xticks avec l'angle spécifié.

Importer Matplotlib.pypllot comme plt
Importer Seaborn comme SNS
Importer des pandas en tant que PD
df = pd.DataFrame ('Date': ['2021-04-01', '2022-05-01',
«2022-06-01», «2022-07-01»,
«2022-08-01», «2022-09-01»,
«2022-10-01», «2022-11-01»,
'2022-12-01'],
«A»: [35, 47, 18, 12, 11, 10, 31, 29, 62],
'B': [72, 66, 78, 13, 19, 25, 35, 45, 86],
'C': [23, 73, 82, 28, 62, 87, 26, 45, 56],
'D': [22, 75, 26, 34, 15, 14, 54, 25, 24])
sns.lineplot (x = "date", y = "a",
data = df)
PLT.xticks (rotation = 20)
PLT.montrer()

Le tracé de la série Times est rendu à l'intérieur de la figure suivante. Cette figure est l'intrigue temporelle à une seule colonne:

Exemple 2: Création d'un tracé de séries chronologiques avec de nombreuses colonnes en utilisant un tracé de ligne

Le graphique de la série temporelle précédente est rendu avec une seule colonne. Ici, nous avons importé les modules Seaborn, Panda et Matplotlib pour rendre le complot de la série chronologique. Ensuite, nous avons créé des données qui ont quatre champs définis. Le premier champ est défini avec les dates et définit la date du nom. Dans les autres champs, nous avons fixé le nom de la voiture, qui montre les ventes de la voiture à une date spécifique.

Après cela, nous avons appelé l'intrigue de la ligne Seaborn deux fois mais avec les noms des différents champs. L'axe X est attribué à la date du champ, et l'axe y est affecté au champ BMW et Alto. Nous définissons l'étiquette pour l'axe y et la rotation des astuces pour l'axe x avec un angle de 20.

Importer Matplotlib.pypllot comme plt
Importer Seaborn comme SNS
Importer des pandas en tant que PD
df = pd.DataFrame ('Date': ['2021-04-01', '2022-05-01',
«2022-06-01», «2022-07-01»,
«2022-08-01», «2022-09-01»,
«2022-10-01», «2022-11-01»,
'2022-12-01'],
«BMW»: [14, 43, 24, 15, 45, 14, 11, 25, 65],
«Ferrai»: [42, 26, 88, 35, 75, 5, 15, 25, 82],
«Alto»: [19, 43, 62, 58, 52, 87, 36, 5, 26],
'Civic': [54, 15, 46, 15, 65, 24, 74, 15, 24])
sns.lineplot (x = "date", y = "bmw", data = df)
sns.lineplot (x = "date", y = "alto", data = df)
PLT.YLABEL ("BMW et Alto")
PLT.xticks (rotation = 20)
PLT.montrer()

Le tracé de la série chronologique est visualisé avec les champs multiples de la figure du graphique suivant:

Exemple 3: Créez plusieurs parcelles de séries chronologiques à l'aide d'un tracé de ligne

Nous pouvons créer plusieurs parcelles de séries chronologiques avec plusieurs colonnes. Ici, nous avons un exemple d'illustration où nous avons créé les quatre parcelles de séries temporelles avec la fonction de tracé de ligne. Tout d'abord, nous avons créé des données dans une variable représentée par le nom DF. Ensuite, nous avons créé des sous-intrigues pour le graphique de la série temporelle, où nous avons également réglé la taille de la figure à l'intérieur de la fonction intrigue.

Pour chaque sous-intrigue, nous avons réglé la rotation des tiques. Dans le tracé de la ligne, nous avons attribué les colonnes pour les paramètres x et y et réglé la couleur de chaque sous-intrigue en fournissant les noms de couleur. Il y a un paramètre supplémentaire; Tirm_layout est défini avec la valeur qui ajuste le rembourrage des sous-intrigues.

Importer Seaborn comme SNS
Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
df = pd.DataFrame ('Date': ['2022-05-01', '2022-06-01',
«2022-07-01», «2022-08-01»,
«2022-09-01», «2022-10-01»,
«2022-11-01», «2022-12-01»],
'Col_a': [47, 18, 12, 11, 10, 31, 29, 62],
'Col_B': [66, 78, 13, 19, 25, 35, 45, 86],
'Col_c': [73, 82, 28, 62, 87, 26, 45, 56],
'Col_d': [75, 26, 34, 15, 14, 54, 25, 24])
Fig, ax = plt.sous-intrigues (2, 2, FigSize = (10, 6))
sns.lineplot (x = "date", y = "col_a",
color = 'g', data = df,
AX = AX [0] [0])
hache [0] [0].tick_params (labelrotation = 15)
sns.lineplot (x = "date", y = "col_b",
color = 'b', data = df,
AX = AX [0] [1])
hache [0] [1].tick_params (labelrotation = 15)
sns.lineplot (x = "date", y = "col_c",
color = 'r', data = df,
AX = AX [1] [0])
hache [1] [0].tick_params (labelrotation = 15)
sns.lineplot (x = "date", y = "col_d",
color = 'y', data = df,
AX = AX [1] [1])
hache [1] [1].tick_params (labelrotation = 15)
figue.serré_layout (pad = 1.25)
PLT.montrer()

Ici, nous avons plusieurs représentations de tracé de séries chronologiques avec les différentes colonnes et les différentes lignes de couleur en utilisant le tracé de ligne.

Exemple 4: Créez un tracé de séries chronologiques en utilisant un tracé de barre

Les valeurs observées sont représentées dans des barres rectangulaires à l'aide d'un tracé de barre. La technique Barplot () de SeaBorn est utilisée pour construire des graphiques de bar dans le module SeaBorn de Python. Lors de l'affichage des données continues de séries chronologiques, un graphique à barre peut être utilisé.

Ensuite, nous avons défini les données du tracé de la série temporelle à l'aide de la fonction du module Panda appelé un cadre de données. À l'intérieur du cadre de données, nous définissons les dates et créons une liste de nombres représentant le pourcentage de fréquentation. Avec la fonction to_datetime (), nous avons défini le format de date pour les parcelles de séries chronologiques. Nous avons également défini la taille de la figure du tracé de la série chronologique. Après cela, nous avons une fonction barplot () qui prend les valeurs pour les paramètres x et y pour le tracé de la série chronologique.

Importer des pandas en tant que PD
Importer Matplotlib.pypllot comme plt
Importer Seaborn comme SNS
df = pd.DataFrame ("Date": ['01052022', '01062022', '01072022', '01082022',
'01092022', '01102022'],
"Associé": [88,78,90,68,84,75])
df ["date"] = pd.to_datetime (df ["date"], format = "% d% m% y")
PLT.Figure (FigSize = (10,9))
sns.barplot (x = 'date', y = 'présence', data = df)
PLT.montrer()

Pour les données de séries chronologiques, le graphique suivant fournit une autre visualisation:

Conclusion

Ceci est un aperçu de base de la façon de générer des tracés de séries chronologiques pour l'entrée liée au temps. Lorsque vous avez plusieurs points de données dans une période de temps spécifiée, un tracé de la série temporelle est une excellente approche pour représenter vos données. De la création d'un petit ensemble de données avec une séquence de pandas à l'intégration d'un ensemble de données du monde réel et à des tracés de séries chronologiques dépendant de vos besoins, cet article vous guide à travers tout ce que vous devez savoir.