Régression linéaire dans r

Régression linéaire dans r
L'une des méthodes d'analyse des données les plus utilisées est la régression. L'apprentissage automatique progresse, et avec elle vient un algorithme bien connu: la régression linéaire. Cet article vous familiarisera avec la façon d'utiliser la fonction de régression linéaire du R. Les modèles de régression ajustent les lignes aux données observables pour interpréter les associations avec les variables. Vous pouvez utiliser la technique pour déterminer comment une variable dépendante change comme les variables indépendantes.

L'exploration de régression est une technique statistique populaire pour établir un modèle de relation entre deux variables. L'une de ces variables est appelée variable prédictive, et sa valeur est déterminée par des études. La variable de réponse est l'autre variable, et la variable prédictive lui permet d'obtenir une valeur.

Quelle est la régression linéaire dans le langage de programmation R dans Ubuntu 20.04?

Les deux variables sont liées par une équation de régression linéaire, où la puissance exponentielle des deux variables est une. Lorsqu'il est représenté comme un graphique, une connexion linéaire indique une ligne droite en mathématiques. Une courbe est formée par une connexion non linéaire dans laquelle la valeur exponentielle de toute variable n'est pas équivalente à une.

Syntaxe de la régression linéaire dans l'équation mathématique:
La régression linéaire a l'équation mathématique polyvalente ultérieure:

y = ax + b

Syntaxe de la régression linéaire dans le langage de programmation R:
Dans R, la syntaxe de base pour effectuer une analyse de régression est la suivante:

lm (y ~ x)

Où y est l'élément qui contient la variable à prédire qui dépend, et x est la formule du modèle mathématique. La commande LM () renvoie les coefficients X mais n'a pas d'autres données statistiques. Nous pouvons utiliser la fonction LM () pour créer un modèle de relation entre le prédicteur et la variable de réponse.

Comment la régression linéaire est utilisée dans R dans Ubuntu 20.04

Voici les quatre étapes pour établir une relation:

  • En utilisant les méthodes LM () en R, construisez un modèle de relation.
  • Collectez d'abord les coefficients du modèle que vous avez construit et utilisez-les pour créer l'équation mathématique.
  • Pour découvrir l'inexactitude moyenne de la prédiction, obtenez un résumé du modèle relationnel également appelé résiduel.
  • Utilisez la fonction prédite () dans R pour prédire la nouvelle valeur pour l'ordonnée X.

Exemple n ° 1: Obtenez les coefficients de régression en créant un modèle de relation

Ici, nous avons créé le modèle de relation simple des deux variables pour effectuer la régression en utilisant la fonction lm (). Cela nous donne les coefficients du modèle relationnel. Voyons cela en utilisant le script suivant:

Comme le montre l'exemple précédent, nous avons déclaré une variable «A» qui est initialisée avec un nombre aléatoire comme représentation vectorielle. Ensuite, nous avons créé une autre variable à laquelle nous avons également attribué la collection des nombres aléatoires. La fonction lm () est appelée à l'intérieur de la nouvelle relation variable. À cette fonction LM (), nous avons passé les variables «A» et «B» pour générer les relations entre eux. À la fonction d'impression, la variable de relation est transmise pour afficher la sortie.

Lorsque le code de régression précédent est exécuté, il montre la régression des résultats des coefficients de la variable «A».

Exemple n ° 2: Obtenez un résumé de la relation

La méthode Résumé () en R peut être utilisée pour afficher les résultats du modèle. Cette fonction crée une table avec les entrées les plus essentielles du modèle linéaire.

Ici, nous avons créé la variable «A» à laquelle nous avons attribué la collection de certains nombres. Il existe une autre variable «B» qui a également un nombre aléatoire. Ces variables sont maintenant appelées à l'intérieur de la fonction LM () qui est stockée dans la relation variable. Ici, la variable «b» est la variable dépendante qui doit être prédite. Dans la fonction d'impression, nous avons une fonction de résumé pour la relation de régression. Nous avons passé la variable de relation à l'intérieur de la fonction de résumé comme une entrée.

Ce tableau de sortie résume la formule qui a généré les résultats («appel») et décrit les résidus du modèle («résidus»), qui représentent comment l'ensemble du modèle correspond aux données réelles. La table «Coefficients» vient ensuite. La première ligne affiche les estimations d'ordonnance Y, tandis que la deuxième ligne montre le coefficient de régression du modèle.

Exemple # 3: Utilisation de la fonction de prédiction pour de nouvelles valeurs

Nous utilisons la fonction de prédiction dans la régression linéaire pour les nouvelles valeurs. Cette fonction apporte deux paramètres à l'objet et aux données nouvellement créées qui sont le vecteur. La formule qui a déjà été produite avec la fonction lm () est appelée objet. Les nouvelles données vectorielles comprennent la nouvelle valeur pour la variable prédictive.

Comme le reflète l'image précédente, nous avons d'abord créé deux vecteurs, «V1» et «V2». Ensuite, nous avons appelé ces vecteurs dans la fonction LM (). Le vecteur «V1» est la variable prévue et le «V2» est la variable de réponse. Ensuite, avec la nouvelle variable «X», nous constatons que la nouvelle valeur avec le «V1» est égal à 150. La fonction de prédiction prend l'objet «x» et les résultats de la fonction lm ().

Lorsque le script R précédent est exécuté, il génère les résultats suivants:

Exemple n ° 4: Rendez le tracé de régression linéaire

Nous pouvons également créer le tracé de régression de la doublure dans R. Nous avons visualisé le graphique de régression linéaire du script suivant:

Nous avons créé le prédicteur et la variable de réponse comme «x» et «y». Ensuite, nous les avons appelés à l'intérieur de la fonction lm (). Le fichier PNG de tracé est créé lorsque le tracé est visualisé. Ensuite, nous avons stylé notre tracé de régression linéaire avec certaines entrées dans la fonction de tracé.

Vous pouvez voir l'intrigue de régression linéaire comme suit:

Conclusion

La régression linéaire de l'article en r se termine ici. La régression linéaire est un sujet très vaste, mais nous avons livré toutes les explications possibles qui sont nécessaires à ce sujet. Le lien entre deux variables peut être estimé en utilisant une régression linéaire. Ici, nous avons couvert quelques exemples de régression linéaire. Nous avons la fonction LM () utilisée dans la régression linéaire. Ensuite, nous avons compris la fonction de résumé de régression linéaire. La fonction de prédiction est également démontrée et nous avons également représenté la régression linéaire graphiquement.