Tracer.exprimer.histogramme

Tracer.exprimer.histogramme
L'une des parcelles les plus courantes de l'analyse statistique est un histogramme. C'est l'un des moyens les plus efficaces et les plus faciles d'implémenter le type de tracé qui montre la distribution de fréquence. Il est très similaire à un graphique de bar avec quelques différences majeures. Considérez-le comme un complot de barre agrégé.

Dans ce tutoriel, nous apprendrons comment créer un tracé d'histogramme à l'aide du module Plotly Express.

Tracer.exprimer.histogramme ()

Dans Plotly Express, nous utilisons la fonction histogram () pour créer des tracés d'histogramme. La fonction fournit une syntaxe comme indiqué:

tracer.exprimer.Histogramme (data_frame = non, x = aucun, y = non, color = non, motive_shape = non, facet_row = non, facet_col = non, facet_col_wrap = 0, facet_row_spacing = non, facet_col_spacing = non, hover_name = non, hover_data = non, non, Animation_Frame = Aucun, Animation_Group = Aucun, catégorie_orders = aucun, labels = non, colore_discrete_sequence = Aucun, colore_discrete_map = non, motive_shape_sences = non, motive_shape_map = non, marginal = non, opacity = non, orientation = non, barmode = 'Relative', marginal = Barnorm = aucun, histnorm = aucun, log_x = false, log_y = false, range_x = non, range_y = non, histfunc = non, cumulatif = non, nbins = non, text_auto = false, title = non, template = non, width = Aucun, hauteur = aucun)

Voici les paramètres de fonction les plus utiles que vous aurez besoin de connaître:

  1. Data_frame - spécifie la trame de données contenant les noms de colonne. Vous pouvez transmettre cette valeur en tant que DataFrame, un dictionnaire ou un objet Array_like.
  2. X - Spécifie les valeurs utilisées pour positionner les marques le long de l'axe x le long de la coordonnée cartésienne. Cela peut être un nom de colonne dans un cadre de données ou une série Pandas.
  3. y - similaire à x mais les valeurs spécifiées dans ce paramètre sont utilisées pour positionner les marques le long de l'axe y.
  4. couleur - définit les valeurs utilisées pour attribuer une couleur unique aux marques.
  5. Cumulatif - spécifie si les valeurs de l'histogramme sont cumulatives.
  6. NBINS - Spécifie le nombre de bacs.
  7. Histnrom - Spécifie le mode dans lequel les bacs sont créés. Les valeurs acceptées incluent:
    1. 'pour cent'
    2. 'probabilité'
    3. 'densité'
    4. 'densité de probabilité'

La fonction renverra ensuite un tracé d'histogramme de type graph_objects.Chiffre.

Exemple - Utilisation des données GAPMINDER ()

Nous pouvons créer un histogramme en utilisant les données GapMinder dans Plotly. Prenez l'exemple de code indiqué ci-dessous:

Importer un terrain.Exprime comme PX
df = px.données.GapMinder ().Query ("Continent == 'Europe'")
Fig = px.histogramme (df, x = 'gdppercap')
figue.montrer()

Dans l'exemple ci-dessus, nous utilisons les données GapMinder () de Plotly Express. Nous tracerons ensuite un histogramme montrant la distribution du PIB par habitant des pays du continent européen.

Une fois que nous exécutons le code ci-dessus, nous devrions voir un histogramme comme indiqué:

Exemple 2 - Utilisation de données catégorielles

Nous pouvons également créer un histogramme de données catégorielles en spécifiant les paramètres x et y.

Prenez l'exemple de code indiqué ci-dessous:

Importer un terrain.Exprime comme PX
df = px.données.GapMinder ().Query ("Continent == 'Europe'")
Fig = px.histogramme (df, x = 'country', y = 'gdppercap')
figue.montrer()

Dans ce cas, l'histogramme montrera chaque pays et la somme du PIB par habitant comme indiqué dans la figure ci-dessous:

Exemple 3 - Spécification du type de normalisation

Par défaut, Plotly créera un histogramme avec chaque échantillon dans chaque bac. Cependant, nous pouvons spécifier le mode dans lequel nous souhaitons présenter les bacs en utilisant le paramètre Histnorm.

Regardons divers exemples:

Densité de probabilité

Fig = px.histogramme (df, x = 'gdppercap', histnorm = 'densité de probabilité')
figue.montrer()

Dans cet exemple, nous créons un histogramme de densité de probabilité qui est une somme des zones de barre égale à 1.

La figure résultante est comme indiqué:

Vérifiez la liste des paramètres pour apprendre les différents types que vous pouvez spécifier.

Exemple 4 - Spécifiez le nombre de bacs

Par défaut, Plotly choisira le nombre de bacs afin qu'il soit comparable au nombre d'échantillons dans un bac. Cependant, nous pouvons spécifier le nombre de bacs à l'aide du paramètre NBINS.

Un exemple est comme indiqué:

Fig = px.histogramme (df, x = 'gdppercap', nbins = 50)
figue.montrer()

Dans l'exemple ci-dessus, nous spécifions le nombre de bacs à 50. Cela devrait renvoyer une figure comme indiqué:

Exemple 5 - Spécifiez le paramètre de couleur

Nous pouvons également spécifier le paramètre de couleur. Cela affectera une couleur unique basée sur le nom des colonnes spécifiées.

L'exemple de code est comme indiqué:

Fig = px.histogramme (df, x = 'gdppercap', color = 'country')
figue.montrer()

La figure résultante:

Dans ce cas, Plotly affectera une couleur unique à chaque pays dans le tracé comme spécifié par le paramètre de couleur.

Exemple 6 - Histogramme horizontal

Plotly nous permet également de créer des histogrammes horizontaux. Jetez un œil au code ci-dessous:

Fig = px.histogramme (df, x = 'gdppercap', y = 'country', color = 'country')
figue.montrer()

Dans ce cas, nous traçons un histogramme de la somme du PIB par habitant de chaque pays. Le code ci-dessus doit renvoyer une figure comme indiqué:

Exemple 7 - Tri par commande de catégorie

Dans certains cas, nous pouvons vouloir trier le tracé résultant en fonction d'une valeur spécifique. Par exemple, dans l'histogramme ci-dessus, nous pouvons trier l'histogramme en fonction du total gdpperpap dans l'ordre croissant.

En utilisant la fonction Update_xaxes ou Update_yaxes, nous spécifions comment nous souhaitons trier les données.

Dans notre exemple, nous souhaitons trier l'axe y. Par conséquent, nous utiliserons la fonction update_yaxes (). Dans la fonction, nous pouvons spécifier le paramètre et la méthode de catégorieORS dans laquelle nous souhaitons trier les données. Dans ce cas, «total descendant».

Nous pouvons exécuter le code comme indiqué:

Fig = px.histogramme (df, x = 'gdppercap', y = 'country', color = 'country').Update_yaxes (catégorieOrder = 'Total Descending')
figue.montrer()

Le code ci-dessus doit entraîner une figure comme indiqué:

Conclusion

Dans cet article, nous avons exploré comment utiliser la fonction histogram () du module Plotly Express. La fonction nous permet de créer des histogrammes de diverses données.