Quel est l'opérateur Tilde dans le langage de programmation R dans Ubuntu 20.04?
L'opérateur Tilde ~ est utilisé dans les formulations de modèle statistique pour représenter la corrélation entre les variables dépendantes et indépendantes dans le langage informatique r. Le paramètre de contrôle (variable dépendante ou résultat) est spécifié sur le côté gauche du symbole Tilde, et la variable prédictive est spécifiée sur le côté droit du symbole Tilde (variables indépendantes). La variable dépendante est celle sur le côté gauche de l'opérateur Tilde, tandis que la variable indépendante est celle à droite (s) à droite (s). En conséquence, l'opérateur Tilde aide à la définition de la relation de la variable dépendante avec la ou les variables indépendantes du côté droit de l'opérateur Tilde.
Utilisation de la fonction LM pour effectuer la fonctionnalité de l'opérateur Tilde dans le langage de programmation R dans Ubuntu 20.04?
Nous allons parcourir le processus d'implémentation de régression linéaire ajusté au modèle, puis en utilisant le symbole Tilde à l'intérieur de la fonction LM () pour fournir les variables d'entrée (variable ou résultat dépendant) et la variable prédictive du côté droit du Tilde symbole (variables indépendantes). Lorsqu'il est utilisé avec la fonction LM du langage de programmation R, le symbole spécifie les prédicteurs et la variable cible. Les modèles linéaires sont équipés de LM (). La régression, l'analyse de variance à la strate unique et l'analyse de la covariance peuvent toutes être effectuées avec elle.
Syntaxe:
LM (formule, données, sous-ensemble, poids, na.Action, méthode = «qr», modèle = true, x = f, y = f, qr = true, contrastes = null, offset,…)
Nous avons transmis quelques paramètres clés à la fonction LM, qui sont décrits ci-dessous:
formule: -Un objet de classe «Formule» est une représentation symbolique du modèle qui sera ajusté.
données: -Les variables du modèle sont stockées dans un ensemble de données, une liste ou un environnement facultatifs.
sous-ensemble: un vecteur qui spécifie un sous-ensemble de données à utiliser dans le processus d'ajustement.
poids: -Un vecteur de poids qui peuvent être utilisés dans le processus d'ajustement en option; Vecteur numérique ou nul. Les moindres carrés pondérés avec des poids sont utilisés si non nuls.
Comment l'opérateur Tilde (~) fonctionne dans le R dans Ubuntu 20.04?
La méthode LM () en R, qui est utilisée pour estimer les modèles de régression linéaire, est l'endroit où l'opérateur Tilde est le plus généralement utilisé. Utilisons l'opérateur Tilde dans la pratique pour obtenir la main avec cet opérateur particulier dans le langage de programmation R.
Exemple # 1: Utilisation de l'opérateur Tilde dans R dans Ubuntu 20.04
Les exemples suivants montrent comment implémenter l'opérateur Tilde dans une variété de situations.
Dans le script R susmentionné, nous avons créé la variable V1, et à l'intérieur de cette variable, nous avons la fonction RNorm, qui prend la valeur entière comme une entrée. Il existe une autre variable, V2, où nous avons à nouveau utilisé la fonction RNorm qui a généré les nombres distribués au hasard et a également ajouté la variable V1. Nous avons créé notre troisième variable, v3, qui a attribué la fonction RNorm avec la valeur à l'intérieur, et les variables V1 et V2 y sont ajoutées.
Cet ensemble de listes est désormais utilisé pour la création d'ensembles de données. Dans la nouvelle variable DF, nous avons appelé les données.Fonction du cadre, qui prend l'ensemble des listes comme argument. Le modèle d'objet contient la formule pour un modèle de régression linéaire généré avec la fonction LM, avec V3 comme variable dépendante et V1 et V2 comme variables indépendantes. Le résumé de la fonction intégrée du R est déployé ici pour imprimer le résumé du modèle variable.
Le résumé (modèle) génère la sortie suivante, qui montre les appels, les résidus et les valeurs de coefficient pour cette formule de régression linéaire ci-dessus.
Exemple # 2: Utilisation de l'opérateur Tilde avec plusieurs variables prédictives dans R dans Ubuntu 20.04
Nous pouvons utiliser l'opérateur Tilde avec les multiples variables prédictives à l'intérieur de la formule de régression linéaire. Pour une idée plus complète, considérez le code ci-dessous.
Ici, nous avons deux variables, X1 et X2, qui ont le nombre aléatoire généré via la fonction RNorm. Ensuite, nous avons créé une autre variable, x3, qui génère également le vecteur de nombres aléatoires avec le x1 et x2. L'ensemble de données est créé en utilisant ces variables. Ensuite, à l'intérieur de la formule de régression linéaire, l'ensemble de données est passé et le tilde est utilisé entre les x3, x2 et x1.
Le modèle de résumé génère la sortie du script ci-dessus comme ceci:
Exemple # 3: Utilisation de l'opérateur Tilde avec l'ensemble.Fonction des semences dans r dans Ubuntu 20.04
Ici, nous avons utilisé l'ensemble.Fonction des semences pour la formule de régression linéaire qui utilise l'opérateur Tilde pour la cible et les variables prédictives.
L'ensemble.La fonction de semence est ajoutée pour les valeurs de randomisation. Ensuite, nous avons déclaré les variables x1, x2, x3 et y pour créer l'ensemble de données. Après la création de l'ensemble de données, nous avons utilisé la formule de régression linéaire pour l'estimation des variables dépendantes et indépendantes qui sont désignées par le symbole Tilde. Pour générer des statistiques descriptives pour notre modèle de régression linéaire estimé, nous avons utilisé la fonction résumé ()
Le résumé du modèle de régression linéaire est dans la figure suivante.
Conclusion
Cet article traite de l'utilisation de Tilde dans le langage de programmation R. R est un langage informatique largement utilisé pour la recherche statistique appliquée. Il utilise une variété de formules pour divers objectifs. En conséquence, le signe Tilde est largement utilisé dans R. En r; L'opérateur Tilde est utilisé pour distinguer les côtés gauche et droit d'une équation. Nous avons vu divers exemples valides de déploiement de l'opérateur Tilde dans R à l'intérieur de la formule de régression linéaire.