Dans ce tutoriel, nous apprendrons comment créer un tracé d'histogramme à l'aide du module Plotly Express.
Tracer.exprimer.histogramme ()
Dans Plotly Express, nous utilisons la fonction histogram () pour créer des tracés d'histogramme. La fonction fournit une syntaxe comme indiqué:
tracer.exprimer.Histogramme (data_frame = non, x = aucun, y = non, color = non, motive_shape = non, facet_row = non, facet_col = non, facet_col_wrap = 0, facet_row_spacing = non, facet_col_spacing = non, hover_name = non, hover_data = non, non, Animation_Frame = Aucun, Animation_Group = Aucun, catégorie_orders = aucun, labels = non, colore_discrete_sequence = Aucun, colore_discrete_map = non, motive_shape_sences = non, motive_shape_map = non, marginal = non, opacity = non, orientation = non, barmode = 'Relative', marginal = Barnorm = aucun, histnorm = aucun, log_x = false, log_y = false, range_x = non, range_y = non, histfunc = non, cumulatif = non, nbins = non, text_auto = false, title = non, template = non, width = Aucun, hauteur = aucun)Voici les paramètres de fonction les plus utiles que vous aurez besoin de connaître:
La fonction renverra ensuite un tracé d'histogramme de type graph_objects.Chiffre.
Exemple - Utilisation des données GAPMINDER ()
Nous pouvons créer un histogramme en utilisant les données GapMinder dans Plotly. Prenez l'exemple de code indiqué ci-dessous:
Importer un terrain.Exprime comme PXDans l'exemple ci-dessus, nous utilisons les données GapMinder () de Plotly Express. Nous tracerons ensuite un histogramme montrant la distribution du PIB par habitant des pays du continent européen.
Une fois que nous exécutons le code ci-dessus, nous devrions voir un histogramme comme indiqué:
Exemple 2 - Utilisation de données catégorielles
Nous pouvons également créer un histogramme de données catégorielles en spécifiant les paramètres x et y.
Prenez l'exemple de code indiqué ci-dessous:
Importer un terrain.Exprime comme PXDans ce cas, l'histogramme montrera chaque pays et la somme du PIB par habitant comme indiqué dans la figure ci-dessous:
Exemple 3 - Spécification du type de normalisation
Par défaut, Plotly créera un histogramme avec chaque échantillon dans chaque bac. Cependant, nous pouvons spécifier le mode dans lequel nous souhaitons présenter les bacs en utilisant le paramètre Histnorm.
Regardons divers exemples:
Densité de probabilité
Fig = px.histogramme (df, x = 'gdppercap', histnorm = 'densité de probabilité')Dans cet exemple, nous créons un histogramme de densité de probabilité qui est une somme des zones de barre égale à 1.
La figure résultante est comme indiqué:
Vérifiez la liste des paramètres pour apprendre les différents types que vous pouvez spécifier.
Exemple 4 - Spécifiez le nombre de bacs
Par défaut, Plotly choisira le nombre de bacs afin qu'il soit comparable au nombre d'échantillons dans un bac. Cependant, nous pouvons spécifier le nombre de bacs à l'aide du paramètre NBINS.
Un exemple est comme indiqué:
Fig = px.histogramme (df, x = 'gdppercap', nbins = 50)Dans l'exemple ci-dessus, nous spécifions le nombre de bacs à 50. Cela devrait renvoyer une figure comme indiqué:
Exemple 5 - Spécifiez le paramètre de couleur
Nous pouvons également spécifier le paramètre de couleur. Cela affectera une couleur unique basée sur le nom des colonnes spécifiées.
L'exemple de code est comme indiqué:
Fig = px.histogramme (df, x = 'gdppercap', color = 'country')La figure résultante:
Dans ce cas, Plotly affectera une couleur unique à chaque pays dans le tracé comme spécifié par le paramètre de couleur.
Exemple 6 - Histogramme horizontal
Plotly nous permet également de créer des histogrammes horizontaux. Jetez un œil au code ci-dessous:
Fig = px.histogramme (df, x = 'gdppercap', y = 'country', color = 'country')Dans ce cas, nous traçons un histogramme de la somme du PIB par habitant de chaque pays. Le code ci-dessus doit renvoyer une figure comme indiqué:
Exemple 7 - Tri par commande de catégorie
Dans certains cas, nous pouvons vouloir trier le tracé résultant en fonction d'une valeur spécifique. Par exemple, dans l'histogramme ci-dessus, nous pouvons trier l'histogramme en fonction du total gdpperpap dans l'ordre croissant.
En utilisant la fonction Update_xaxes ou Update_yaxes, nous spécifions comment nous souhaitons trier les données.
Dans notre exemple, nous souhaitons trier l'axe y. Par conséquent, nous utiliserons la fonction update_yaxes (). Dans la fonction, nous pouvons spécifier le paramètre et la méthode de catégorieORS dans laquelle nous souhaitons trier les données. Dans ce cas, «total descendant».
Nous pouvons exécuter le code comme indiqué:
Fig = px.histogramme (df, x = 'gdppercap', y = 'country', color = 'country').Update_yaxes (catégorieOrder = 'Total Descending')Le code ci-dessus doit entraîner une figure comme indiqué:
Conclusion
Dans cet article, nous avons exploré comment utiliser la fonction histogram () du module Plotly Express. La fonction nous permet de créer des histogrammes de diverses données.