Les boîtes à boîte sont un type de graphique qui montre comment les données uniformes sont dispersées dans un ensemble de données. L'ensemble de données est divisé en trois quartiles à la suite de cela. Ce graphique représente le jeu de données minimal, maximal, moyen, premier, deuxième et troisième quartile.
Une boîte d'un boîtier commence dans le tout premier quartile (25%) et se termine dans le troisième (75%). En conséquence, la boîte reflète la moitié (50%) des données centrales à travers une ligne à l'intérieur de cela indiquant la moyenne. Malgré l'inclusion des valeurs aberrantes de boxplot, une division est façonnée de chaque côté de la boîte aux données les plus étirées, si elles existent, sera représentée par des cercles.
Ce tutoriel vous éduquera sur la façon d'utiliser R pour fabriquer des boîtes à boîte."
Création de boîtes à boîte dans R
Une boîte et un tracé de moustache peuvent être créés à l'aide de la fonction «boxplot ()» de R. Diverses entrées peuvent être utilisées pour créer ce graphique, y compris les vecteurs et les cadres de données. Dans le graphique équivalent, vous pouvez également saisir une formule en entrée lors de la production de boîtes à boîte pour de nombreux groupes.
Création d'une boîte à boîte à l'aide d'un vecteur en R
Si vous souhaitez créer un tracé de boîte en R à partir d'un vecteur, transmettez simplement le vecteur à la fonction "boxplot ()".
Ici, nous avons créé un vecteur «S» et lui avons attribué une liste de valeurs numériques. À l'aide de la fonction «boxplot ()», transmettez ce vecteur «S» comme paramètre. Le boîtier de boîte en R est défini par défaut, mais si vous voulez le changer en horizontal, vous pouvez le faire en définissant l'expression «horizontale» «vrai."
Un boîtier horizontal créé à partir d'un vecteur s'affiche ci-dessous.
Il est essentiel de garder à l'esprit que les boîtes à caisse obscurcissent la distribution sous-jacente des données. Pour résoudre ce problème, la fonction «stripChart ()» pourrait être utilisée pour insérer des points dans un boîtier à boîte.
Ici, nous avons utilisé la méthode «Jitter."" PCH "signifie des personnages d'intrigue. Le «PCH» par défaut en R est 1, ce qui crée un cercle vide, tandis que «PCH = 19» signifie des cercles solides. Donc ce que nous avons utilisé, ce sont des cercles solides avec une couleur orange. Les valeurs aberrantes ne seront pas trop sousplorées si les points de données sont gênés.
Création d'une boîte à boîte en utilisant «Notch» dans R
Nous pouvons également faire un boîtier à boîte avec une encoche en R. Cela nous aide à déterminer dans quelle mesure les médianes de divers groupes de données interagissent les uns avec les autres. En spécifiant l'argument Notch To True, vous pouvez illustrer les intervalles de confiance à 95% pour la médiane dans le Roxplot R. La boîte représente les limites supérieures et inférieures, tandis que la ligne médiane peut voir la médiane.
Une «encoche» ou un rétrécissement de la boîte, est utilisée autour de la médiane dans les parcelles d'enclu. Les encoches peuvent aider à déterminer l'importance d'un écart dans les médianes. S'il n'y a pas de chevauchement entre l'encoche de 2 boîtes, il y a de fortes chances que les médianes ne soient pas les mêmes.
Le boîtier à boîte tiré de «Notch» est représenté ci-dessous.
Création d'une boîte à boîte à l'aide d'un ensemble de données dans R
Pour créer un boîtier à boîte dans R, vous pouvez également utiliser la fonction DataFrames dans la fonction "boxplot ()". Dans ce cas, nous utiliserons l'ensemble de données intégré à base de base RE."
Ici, vous pouvez voir l'ensemble de données à l'intérieur de la table «poids de poussin». Il contient 4 colonnes de poids, de temps, de poussin et de régime. Toutes les colonnes ont des valeurs numériques qui y sont stockées.
Nous choisirons 2 colonnes, je.e., poids et régime, à partir de l'ensemble de données. À l'aide de la fonction "boxplot ()", nous dessinerons des boîtes à boîte pour la date sélectionnée.
Dans la pièce de code ci-dessus, nous avons conçu un boîtier à boîte de «poids» contre le «régime alimentaire."Nous avons spécifié les noms des variables avec le nom de l'ensemble de données. À l'intérieur des accolades de la fonction «boxplot ()», nous avons utilisé l'opérateur de nom de données de données «Chickeweight», «$» pour spécifier la colonne, et le nom de la colonne «poids», puis la colonne avec le nom de DataFrame «Chickweight $ Diet."
Le boxplot résultant montre clairement la dispersion de l'outil.
Pour rendre ce bar à boîte visuellement meilleur et plus détaillé, vous pouvez ajouter des points. Vous pouvez y parvenir en utilisant la fonction «StripChart ()».
Vous pouvez voir les points que nous avons créés pour afficher la division des données essentielles dans chaque boîte à boîte.
Création de plusieurs boîtes à boîte dans R
La création de plusieurs boîtes à boîte est une autre technique qui peut être utilisée dans la programmation R. Pour implémenter cette méthode, nous utilisons un ensemble de données intégré dans la base R.
L'ensemble de données que nous avons utilisé ici est des «arbres» fournis par R Base. Nous pouvons également ajouter des couleurs au boîtier à boîte. Dans la fonction «boxplot ()», nous définissons la couleur «col» comme «arc-en-ciel», qui mettra des couleurs différentes à chaque boxplot.
Si vous souhaitez tracer un boîtier de boîte distinct pour chaque colonne de votre R DataFrame, vous pouvez le faire avec l'utilisation de la fonction «lapply ()».
Nous allons diviser les graphiques «par» en une ligne ainsi que le nombre de colonnes dans l'ensemble de données dans cet exemple. Les graphiques individuels, en revanche, pourraient être tracés. La fonction «invisible ()» empêche le texte de sortie de la fonction «lapply» d'être visible.
L'image ci-dessous montre le boîtier créé pour chaque colonne de données individuellement.
Conclusion
La programmation R offre une variété d'opérations qui peuvent être effectuées. La création d'un boîtier à boîte est une autre méthode utile et simple pour afficher les données visuellement dans les parcelles. Dans cet article, nous avons discuté de ce que sont les boîtes à boîte et comment ils affichent des données. Nous avons expliqué quatre techniques différentes qui peuvent être utilisées pour dessiner des boîtes à boîte dans R, en utilisant RStudio dans Ubuntu 20.04. Y compris l'utilisation de vecteurs simples pour créer des boîtes à boîtiers, l'utilisation de «Notch», à l'aide de DataFrames et de créer plusieurs boîtes à boîtier également. Nous avons démontré chaque méthode en élaborant différents exemples de codes. Cela rendra l'apprentissage R pour la création de boîtes à boîte beaucoup plus facile pour vous.