Signifie en r

Signifie en r

Des analyses statistiques sont effectuées en utilisant les différentes fonctions intrissées dans R. Ces fonctions sont incluses dans les packages de base de R. Pour générer les résultats en R avec les arguments, les vecteurs sont considérés comme une entrée. Ces fonctions intégrées sont moyennes, médianes et en mode, mais nous ne discuterons que de la moyenne dans ce post. La moyenne joue un rôle important lorsque nous devons trouver où se trouve la valeur centrale d'un ensemble de données. La moyenne d'un ensemble de données conserve également les informations sur toutes les données de l'ensemble.

En général, la moyenne est définie comme la somme des données / éléments / observations divisé par le nombre total de données / éléments / observations.

Quelle est la fonction R MANGE dans Ubuntu 20.04

La moyenne ne peut pas contenir à la fois les caractères numériques et les données numériques, comme le mode. Il ne peut générer des résultats que comme une valeur numérique. Le mode de calcul est une caractéristique intégrée de R, ce qui signifie qu'il a une fonctionnalité définie dans le langage de programmation R. Ces fonctions prédéfinies acceptent un vecteur comme entrée et produisent un résultat en tant que valeur numérique.

La syntaxe de la fonction moyenne est la suivante:

1
Moyenne (x, na.RM)

Où x est le vecteur d'entrée et Na.RM est une valeur booléenne pour ignorer les valeurs manquantes du vecteur d'entrée.

Comment le R signifie-t-il fonctionne dans Ubuntu 20.04?

En R, la moyenne de fonction intégrée () est utilisée pour calculer la moyenne arithmétique des éléments du vecteur numérique et montre le résultat de la forme numérique afin qu'il puisse être passé comme argument.

Nous allons vous montrer comment calculer la moyenne dans le langage de programmation R dans Ubuntu 20.04 Dans ce tutoriel. Il existe de nombreux exemples des différents scénarios de données.

Exemple n ° 1: moyenne simple R d'un vecteur

Pour trouver la moyenne d'un vecteur, nous devons prendre un vecteur ayant les données numériques. Créons un vecteur X pour vous apprendre comment nous pouvons utiliser la fonction moyenne lorsque nous devons trouver la moyenne d'un vecteur.

Lorsque la moyenne est appliquée au vecteur x, elle résumera toutes les valeurs du vecteur x et les divisera par le nombre total de valeurs, qui est 9.

Comme nous pouvons le voir, la moyenne prend le vecteur x comme une entrée et génère une valeur numérique qui est 12.66667. C'était simple car il n'y avait aucune valeur nulle impliquée dans les données. Si une valeur nulle était incluse, le résultat sera différent.

Exemple # 2: Moyenne du vecteur numérique ayant des valeurs NA dans R

Puis un.RM est une option utilisée pour ignorer les valeurs nul ou NA. Il s'agit d'un paramètre logique qui aide la fonction à décider de supprimer ou non les valeurs NA, donc elle peut ne pas affecter le résultat après les calculs. Dans une fonction moyenne, si na.rm = true, il élimine les valeurs de NA. Puis un.RM n'est ni une opération ni une fonction. C'est un paramètre utilisé par les différentes fonctions des données de trame.

Pour trouver la moyenne d'un vecteur dans lequel les valeurs NA sont impliquées, nous pourrions faire face à un problème typique.

Après avoir ajouté une valeur NA au vecteur x1, nous l'avons attribué au vecteur x2 qui nous donne le résultat suivant:

Le vecteur x2 ressemble à la même chose que le vecteur x1. Mais maintenant, la valeur NA est ajoutée à la fin. Lorsque nous appliquons la moyenne au vecteur x2, le problème suivant se produira:

Le résultat, la moyenne (x2) renvoie NA, n'est pas ce à quoi nous nous attendions. Comme mentionné précédemment, la fonction moyenne en R ne peut contenir que des données numériques. Étant donné que la valeur NA n'est pas une données numériques, le NA.RM est utilisé pour ignorer les valeurs NA pour éviter que ce problème se produise.

Il est clairement illustré que le na.L'option RM a éliminé le problème de la valeur NA et généré la moyenne correcte du vecteur x2 qui est 4.625.

Exemple n ° 3: moyenne du vecteur numérique avec option de garniture

Tout comme le na.RM, la garniture est également un paramètre logique utilisé par les fonctions du cadre de données. En général, l'option de finition en moyenne est la moyenne de l'ensemble de données après avoir supprimé un certain pourcentage des plus petites et des plus grandes valeurs de l'ensemble de données. Vous pouvez également dire qu'avant de trouver la moyenne d'un ensemble de données, un pourcentage spécifié des plus petites et des plus grandes valeurs est supprimée.

La syntaxe de la moyenne coupée est la suivante:

1
moyenne (x, trim = 0)

Essayons une garniture de 20% à notre précédent vecteur x1.

Comme vous pouvez le voir dans l'image précédente, la moyenne de V1 sans garniture est 4.625. Mais que se passe-t-il si nous appliquons une garniture de 20%?

Après avoir appliqué une finition de 20%, les 20% sont supprimés de la plus grande et la plus petite valeur de l'ensemble de données, et la valeur de la moyenne passe à 4.8333333.

Exemple n ° 4: Moyenne en R à partir de l'échantillon de données

Pour vous offrir un exemple plus réaliste, nous implémenterons la fonction moyenne d'une colonne de trame de données à partir d'un ensemble de données réel. Ici, nous avons choisi un cadre de données «Iris». Tout d'abord, nous devons télécharger le fichier de données afin que nous puissions implémenter la fonction moyenne à ce sujet.

Les données (iris) sont appuyées sur les données de l'iris.Fichier CSV à notre console. Appeler la tête () est en train de récupérer les titres de tête sur nos données d'iris. L'ensemble de données nous est affiché comme on le voit dans ce qui suit:

Pour trouver la moyenne de la première colonne du tableau précédent de l'ensemble de données, le script suivant peut être utilisé:

Identique à la première colonne, vous pouvez également trouver la valeur moyenne pour les autres colonnes (i.e. sépale.largeur, pétale.longueur et pétale.largeur). Comme discuté plus tôt dans ce sujet, la moyenne ne peut pas contenir de données de caractère. Un problème se produira chaque fois que nous essayons de trouver la moyenne de la 5e colonne car il n'y a pas de valeur numérique dans la colonne des espèces.

Vous pouvez voir que le résultat n'est pas une données numériques. Au lieu de cela, il montre un message d'avertissement que l'argument n'est pas numérique ou logique.

Conclusion

Après avoir couvert ce tutoriel, vous devriez maintenant avoir une meilleure compréhension de la moyenne. Vous devriez également être en mesure de calculer la moyenne en utilisant le langage de script R dans Ubuntu 20.04. La moyenne est l'une des mesures vitales de la recherche statistique. Être conscient de la moyenne peut s'avérer utile pour nous dans les recherches supplémentaires. Cependant, la capacité d'évaluer la moyenne n'implique pas que vous comprenez la recherche statistique et le principe de la moyenne. En R, pour trouver la moyenne d'un ensemble de données, nous avons pratiquement implémenté les multiples exemples de la moyenne avec des vecteurs, des paramètres logiques et des ensembles de données.