Pandas moyens géométriques

Pandas moyens géométriques
Travailler avec le langage de programmation Python rend tout simple et plus facile. Le langage de programmation Python a été conçu pour faciliter la vie du développeur, c'est pourquoi même les développeurs novices et débutants Python tombent amoureux de la programmation et du développement. C'est l'un des meilleurs langages de programmation pour l'analyse des données. De plus, le langage de programmation Python fournit des bibliothèques qui peuvent effectuer un calcul mathématique et statistique.

Les moyens géométriques sont l'une des fonctions Python Pandas qui est utilisée pour calculer la moyenne géométrique d'un ensemble donné de nombres, de liste ou de dataframe. Cet article est conçu pour montrer comment trouver la moyenne géométrique en utilisant des pandas en python.

Que signifie géométrique?

La moyenne géométrique est la moyenne de l'ensemble des nombres qui est généralement appelé taux de croissance annuel composé. Il est utilisé où une liste de nombres doit être multipliée ensemble. En termes simples, c'est la valeur moyenne de l'ensemble des nombres. Pour calculer la moyenne géométrique, nous multiplions simplement tous les nombres présents dans l'ensemble et prenons sa nième racine, où n est le nombre total d'observations présentes dans l'ensemble.

Comment trouver la moyenne géométrique en utilisant des pandas en python?

Il existe plusieurs façons de mettre en œuvre pour calculer les moyens géométriques en utilisant des pandas en python. Cependant, nous allons ici discuter des quatre façons les plus simples et les plus faciles de trouver la moyenne géométrique en utilisant des pandas en python.

Méthode 1: calcul manuel de la moyenne géométrique

La première méthode est très simple mais fastidieuse. C'est comme calculer la moyenne géométrique sur une calculatrice, prendre le produit de tous les nombres, puis prendre la nième racine du produit. Voyons maintenant un exemple de code pour apprendre la méthode manuelle.

Exemple 1

Dans cet exemple, nous fournirons simplement 5 nombres et prendrons leur produit avec * (signe de multiplication), puis nous diviserons le produit par 5 comme 5 est le nombre d'observations. Voyons maintenant le code:

nombres = 10 * 20 * 1 * 5 * 6
n = 5
gm = (nombres) ** (1 / n)
Imprimer («La moyenne géométrique calculée manuellement est:« + str (gm))

Notez que le produit de 10 * 20 * 1 * 5 * 6 est 6000, et la nième racine de 6000 est 5.69. Voir la sortie ci-dessous:

Méthode 2: Utilisation d'une boucle pour calculer la moyenne géométrique

La méthode alternative du processus manuel consiste à fournir tous les nombres d'une liste et à utiliser la boucle pour calculer le produit. Voir l'exemple ci-dessous pour mieux comprendre.

Exemple 2

Dans cet exemple, nous allons simplement mettre tous les nombres dans une liste et utiliser la boucle «pour» pour calculer le produit des nombres fournis dans la liste et appliquer la formule des moyens géométriques. Voir le code ci-dessous.

produit = 1
Nombres = [10, 20, 1, 5, 6]
n = len (nombres)
pour i en nombre:
produit = (produit) * (i)
gm = (produit) ** (1 / n)
Imprimer («La moyenne géométrique calculée manuellement est:« + str (gm))

Après avoir utilisé la boucle «pour», vous obtiendrez le résultat suivant. Maintenant, si vous le remarquez, le résultat est le même que dans l'exemple précédent. Passons à la troisième méthode.

Méthode 3: Utilisez Scipy et Pandas pour calculer les moyennes géométriques

La bibliothèque Pandas à Python est exceptionnellement excellente avec un calcul statistique et mathématique. Il fournit presque toutes les fonctions pour les calculs scientifiques, statistiques et mathématiques. Les pandas fournissent une fonction gmean () pour trouver la moyenne géométrique d'un ensemble de nombres. Dans l'exemple ci-dessous, nous montrerons comment utiliser la fonction gmean () pour calculer les moyens géométriques en utilisant Scipy et Pandas.

Exemple 3

Cet exemple est très simple; Nous allons simplement importer la bibliothèque «statistiques» de Scipy et utiliser la fonction gmean () sur un ensemble de nombres. Voir le code ci-dessous:

à partir des statistiques d'importation Scipy
GM = statistiques.gmean ([10, 20, 1, 5, 6])
Imprimer («La moyenne géométrique calculée manuellement est:« + str (gm))

Comme nous avons utilisé le même ensemble de nombres, la sortie doit donc être la même que dans les exemples précédents. Voir la sortie ci-dessous.

Notez que la fonction gmean () a fourni le même résultat que dans les exemples ci-dessus, ce qui signifie que gmean () est capable d'effectuer le calcul de quelques lignes de code avec seulement l'appel de fonction gmean ().

Créons maintenant un dataframe, puis utilisons Scipy et Pandas dessus pour voir comment GMean () se comporte avec des dataframes. Tout d'abord, nous créerons un dataframe et nous appellerons ensuite la fonction GMean () pour calculer la moyenne géométrique d'un dataframe. Voir le code ci-dessous:

à partir de Pandas Import DataFrame
de Scipy.Statistiques.MSTATS IMPORT GMEAN
list1 = 'nombres': [10, 20, 1, 5, 6]
df = dataframe (list1)
gm = gmean (df.loc [:, «nombres»])
Imprimer («La moyenne géométrique calculée manuellement est:« + str (gm))

Voir la sortie ci-dessous. Notez que, comme précédemment, le même résultat est généré. Maintenant, passons au quatrième et à la dernière méthode.

Méthode 4: Utilisez Numpy pour calculer la moyenne géométrique

Cette méthode consiste à calculer la moyenne géométrique en utilisant la fonction intégrée fournie par la bibliothèque Numpy. Voir l'exemple ci-dessous pour apprendre à utiliser la fonction intégrée Numpy dans le code Python.

Exemple 4

Dans cet exemple, nous allons simplement créer une fonction personnalisée pour calculer la moyenne géométrique à l'aide de fonctions Numpy intégrées Log () et Mean (). La fonction personnalisée et la fonction gMean () sont toutes deux conçues pour remplir la même fonction afin qu'elles fournissent le même résultat. Voir le code ci-dessous pour apprendre à définir la fonction Python personnalisée qui peut calculer la moyenne géométrique pour vous.

Ici, nous utiliserons la fonction log () pour trouver d'abord le journal de l'ensemble des nombres, alors nous appliquerons la fonction moyenne () normale, et après cela, la fonction exp () est appliquée pour convertir la moyenne normale en moyenne géométrique. Voir le code ci-dessous pour avoir une meilleure compréhension.

Importer Numpy comme NP
def g_mean (x):
a = np.journal (x)
retour np.Exp (A.moyenne())
gm = g_mean ([10, 20, 1, 5, 6])
Imprimer («La moyenne géométrique calculée manuellement est:« + str (gm))

Comme nous avons fourni les mêmes données que l'entrée afin que la sortie soit à nouveau la même. Voir la sortie ci-dessous.

Conclusion

Dans cet article, nous avons appris à calculer les moyens géométriques à Python. Nous avons démontré quatre méthodes différentes pour calculer la moyenne géométrique à Python. La première méthode est manuelle, la deuxième méthode utilise la boucle 'for', la troisième méthode utilise le scipy et les pandas, et la dernière méthode utilise la fonction personnalisée Numpy pour calculer les moyens géométriques.