Histogramme en r

Histogramme en r

Les histogrammes sont des diagrammes composés de rectangles pour afficher tout ensemble de données statistiques. Ils sont utilisés pour résumer graphiquement la distribution des informations statistiques. Les histogrammes sont très polyvalents et assurent la simplicité. Ils sont utilisés pour représenter les fréquences d'une variable dans les plages continues.

Nous essaierons de couvrir l'histogramme dans cet article. Nous allons d'abord passer par la syntaxe du Fonction hist () Avant de regarder quelques exemples de la façon de créer des histogrammes dans R en utilisant cette méthode.

L'histogramme en r:

Dans la programmation R, les histogrammes sont très utiles pour visualiser la plage définie par l'utilisateur. L'histogramme est l'un des tracés les plus souvent utilisés pour l'affichage et l'analyse des données graphiques. Les histogrammes sont généralement représentés comme des rectangles verticaux alignés le long d'un axe bidimensionnel, affichant une comparaison des groupes de données. Les dénombrements de données sont représentés par la taille des colonnes ou des boîtes rectangulaires sur l'axe des y, tandis que les valeurs des groupes de données sont affichées sur l'axe X. Les histogrammes aident à évaluer les données. Dans r, un histogramme peut être généré pour une variable spécifique. Ceci est important pour la sélection des variables et les applications d'apprentissage des fonctionnalités dans les projets de science des données.

Construire un histogramme dans R:

La syntaxe pour la construction d'un histogramme dans R est:

# Hist (V, Main, XLab, YLAB, Xlim, Ylim, Breaks, Col, Border)

"V»Représente les données utilisées pour créer l'histogramme. "principal"Est le titre du char,"col"Est la couleur des barreaux,"xlab"Est une étiquette pour l'axe horizontal, et"ylab»Est une étiquette pour l'axe vertical. "xlim«Est utilisé pour définir la limite de l'axe horizontal. "ylim”Est ​​utilisé pour définir la limite de l'axe vertical. "casser»Est utilisé pour spécifier la largeur des bacs. "frontière»Spécifie la couleur de la bordure du bar.

Nous effectuerons différents exemples pour comprendre et implémenter tous les paramètres mentionnés dans le paragraphe ci-dessus.

Exemple # 1: Création d'un histogramme simple dans R à l'aide d'un ensemble de données ou d'un vecteur intégré:

L'histogramme a besoin d'un ensemble de données intégré à importer dans R pour évaluation. De nombreux modules et fonctions graphiques sont inclus dans R ainsi que ses bibliothèques. Nous avons utilisé l'ensemble de données intégré aux passagers aériens dans cet exemple. Pour construire un histogramme pour un ensemble de données particulier, utilisez la fonction hist () avec un signe $ pour choisir une colonne spécifique de données de l'ensemble de données.

L'exemple suivant crée un histogramme des valeurs dans l'ensemble de données du passager aérien:

L'histogramme résultant ressemble à ceci:

Dans l'exemple ci-dessus, vous avez appris à créer un histogramme en utilisant l'ensemble de données intégré. De plus, vous pouvez générer rapidement un histogramme en utilisant la fonction «hist ()» qui évalue un histogramme en fonction des valeurs que vous spécifiez. Vous fournissez le nom de votre ensemble de données entre les supports de cette fonction. Cette fonction accepte une liste de nombres pour tracer l'histogramme.

À l'aide de l'option «Main», vous pouvez ajouter un titre à l'histogramme. En passant «Main» comme entrée à la méthode HIST (), vous pouvez modifier le nom de l'histogramme. Dans ce scénario, vous créez un histogramme à partir de la collection de données «S» appelée «tous les étudiants». Tandis que "xLab" sera utilisé pour nommer l'axe X.

Vous pouvez voir l'histogramme de sortie de l'hist () avec une liste de nombres:

Exemple n ° 2: ajoutant de la couleur, de la bordure et des pauses à l'histogramme:

Les représentations par défaut vous aident rarement à analyser vos histogrammes. Vous devez prendre un autre mouvement pour acquérir une connaissance plus approfondie de vos histogrammes. R fournit diverses solutions rapides et simples pour optimiser la représentation du diagramme tout en utilisant la fonction hist ().

L'argument «col» sera utilisé pour ajouter de la couleur à l'histogramme, puis mentionner le nom de la couleur. En dehors de cela, vous pouvez également ajouter la couleur de la bordure aux bacs de l'histogramme en utilisant le paramètre «Border». L'option «Breaks» nous permet de choisir le nombre de barres dans l'histogramme. Ce nombre, cependant, n'est qu'une recommandation. Nous pouvons définir le nombre de barres dans l'histogramme avec le paramètre «Breaks». Vous pouvez donner au paramètre «Breaks» un vecteur de points d'arrêt si vous voulez un contrôle supplémentaire sur les points d'arrêt entre les poubelles. Ceci est possible avec la fonction «c ()».

Histogramme de sortie coloré:

Exemple # 3: réglage des plages de l'axe des x et de l'axe y:

Pour spécifier la plage de valeurs, utilisez les arguments «xlim» et «ylim». La plage fournie à ces deux arguments déterminera les axes de notre graphique d'histogramme. Assis-nous à la façon dont cela se fait ci-dessous.

Cet histogramme dans l'extrait de code ci-dessus a un axe x limité aux valeurs de 0 à 50 et un axe y limité aux valeurs 0 à 4. Lors de l'utilisation de «Xlim» et «Ylim», la méthode «C ()» est appliquée pour restreindre les valeurs sur les axes. Il faut deux valeurs: une pour le début et une pour la fin.

Le script ci-dessus crée un histogramme de valeurs de données à partir de «S» et l'appelle «Tous les élèves», qualifie l'axe des x comme «non. des étudiants », ajoute une bordure noire et une couleur bleue aux bacs, limite l'axe x de 0 à 50, axe y de 0 à 4, et change la largeur de la poubelle à 6.

Exemple n ° 4: Histogramme avec motif de remplissage éclos:

Vous pouvez également construire un histogramme avec le motif éclos. Dans cet exemple, l'histogramme de remplissage d'éclosion avec des lignes inclinées à 45 ° est construit. Dans un histogramme, la fréquence est déterminée par la zone de la barre plutôt que par sa hauteur, qui fait référence à sa «densité». Les lignes d'éclosion seront bleues tandis que les bordures seront noires.

Lorsque nous exécutons le code ci-dessus, nous obtenons le résultat suivant:

Conclusion:

Dans ce sujet, nous avons tenté d'explorer les principes fondamentaux de la construction d'histogramme en R en utilisant RSTUDIO. Pour utiliser les arguments dans la méthode «hist ()», nous exécutons plusieurs ensembles de code. Dans quatre cas, nous avons couvert la construction de base d'un histogramme, comment ajouter la couleur et la bordure à un histogramme, comment restreindre les plages des axes x et y, et comment ajouter l'éclosion aux histogrammes. Vous seriez en mesure d'améliorer l'attrait visuel de votre histogramme en suivant ces exemples simples et faciles.