«Nous vivons à une époque où nous sommes entourés de la science des données, des ensembles de données plus importants, des ordinateurs de puissance de calcul élevés et de l'intelligence artificielle. La science des données et l'intelligence artificielle ont fait leur chemin vers la navigation autonome des véhicules; Les images sont reconnues par eux, décidant des secteurs énergétiques et financiers, des secteurs boursiers et nos cercles sociaux ont également été révolutionnés par l'apprentissage automatique, puis les progrès des sciences biomédicales. La régression linéaire est l'une des techniques d'apprentissage automatique les plus importantes qui nous permet d'effectuer une analyse statistique des données ou des calculs scientifiques, et quel que soit le domaine que nous choisissons où nous voulons devenir artificiellement intelligents, nous rencontrerons une régression linéaire.
La régression linéaire est une méthode d'apprentissage automatique qui est utilisée pour apprendre la relation entre une variable dépendante, disons «y», et les diverses variables indépendantes «x». Sur la base de cette relation entre les variables, la régression linéaire prédit les événements futurs pour le «Y». Les variables de régression linéaire sont les caractéristiques qui représentent les attributs de l'observation, et l'observation est le seul point de données de l'ensemble de données. La sortie prévue dépend de ces observations et des caractéristiques. Les applications de la régression linéaire comprennent la prédiction des prix des logements en fonction des caractéristiques (comme la zone de la maison, les chambres dont il dispose, l'intérieur de la maison), les prévisions météorologiques, la prédiction boursière, etc."
Procédure
L'article montrera la méthode de mise en œuvre des modèles de régression linéaire. Nous appliquerons ce modèle à un ensemble de données, et pour implémenter ce modèle, nous allons suivre certaines étapes pour former d'abord le modèle pour apprendre à prédire, puis nous testerons le modèle pour vérifier à quel point la prédiction du modèle est proche de la sortie réelle.
Syntaxe
La syntaxe du modèle de régression est la suivante:
$ modèle = régression linéaire ()
Nous utiliserons la fonction mentionnée ci-dessus pour implémenter le modèle de régression en ajustant l'ensemble de données à ce modèle. Nous allons former les données sur le modèle de régression linéaire pour estimer la valeur de la sortie en utilisant l'hypothèse et la fonction de perte:
Y_predit (h (x) = b0 + b1 * x), qui est la valeur prévue pour la réponse de sortie «y» du modèle.
Fonction de perte = réel_y - y_preddit
Valeur de retour
La valeur de retour pour le modèle de régression est continue car la régression a une variable dépendante continue en tant que sortie, «y» et plusieurs variables, «x», qui peuvent être discrets ou continus.
Exemple # 01
Commençons par mettre en œuvre le modèle de régression linéaire. Pour la mise en œuvre de cette fonction, nous utiliserons l'interprète «Spyder» de Python. Pour commencer à implémenter le modèle, nous devons appliquer certaines fonctions et classes à partir des différents packages de bibliothèque. La première et la première bibliothèque de cette implémentation serait la «Numpy». Nous connaissons tous cette bibliothèque Numpy car cela permet les opérations et l'implémentation des tableaux multidimensionnels et des matrices, et c'est un package open-source. Ceci sera utilisé dans le programme pour implémenter le tableau avec différentes dimensions.
Un autre package important est le «Scikit-learn» Ce package est construit sur le Numpy, et il permet de réduction du prétraitement et de la dimensionnalité des données et implémente les modèles de régression, les classifications et le regroupement. Nous utiliserons ce package pour la mise en œuvre du modèle de régression linéaire dans Python. Pour importer ce package, nous utiliserons la commande «Importer» Numpy avec le préfixe nommé «NP», puis à partir du package du Scikit Learn, nous importerons le modèle de régression linéaire comme «de Sklearn.linéaire_model importer linéairesegression ».
Après avoir importé ces packages, il est maintenant temps de créer les données avec lesquelles nous voulons travailler et pour le faire, nous définirons la variable dépendante (sortie) comme «Y» et la variable indépendante (régresseur) comme «X». Pour cet exemple, nous garderons ces variables simples en tant qu'objet de tableau 1D, et cela marque les données les plus simples pour la régression. Nous déclarerons le «X» comme le «NP». Array ([2, 12, 22, 32, 42, 52]). Reshape (-1, 1) ”et le« Y »comme« NP. tableau ([2, 10, 14, 20, 32, 36]) ». Le Y est unique, et nous avons remodelé le X à être (-1, 1) car nous voulons que le X n'a qu'une seule colonne et plusieurs lignes, donc elle a deux dimensions car la forme du X est (6, 1).
Maintenant, nous allons adapter ces variables au modèle de régression linéaire, et pour ce faire, nous appellerons la méthode «Régression linéaire (). ajustement (x, y) »et attribuez-le à la variable« modèle ». Une fois que nous avons monté le modèle maintenant, vérifions si le modèle fonctionne ou non en appelant et en appliquant le «.Score »sur le modèle comme« modèle. Score (x, y) ». Le .Le score prend également le prédicteur comme «x» et la réponse comme «y», et il donne au r ^ 2, qui est le coefficient de la détermination qui signifie qu'il indique à quel point le modèle peut faire des prédictions.
Maintenant, pour vérifier les valeurs des attributs de «l'hypothèse = b0 + b1 * x», nous utiliserons le «modèle. Intercept », qui donnera« B0 »et« modèle. coef_ ”qui renverra la valeur de« b1 »qui sont les valeurs estimées du modèle pour le« y ». Maintenant, après avoir obtenu ces valeurs, nous prévoirons l'utilisation du modèle appelant le «modèle. Prédire (x) ”et enregistrez-le dans le Y_Predit. La réponse sera prédite par le modèle, et nous avons donc formé notre modèle; Maintenant, pour tester le fonctionnement du modèle sur l'ensemble de données de test, nous passerons les nouvelles valeurs de X aux paramètres du «modèle. prédire (x_new) ». Le modèle donnera aux valeurs prévues en réponse à la sortie du «X» nouvellement défini. Le code pour la formation puis le test du modèle de régression linéaire est donné ci-dessous sur la figure.
Conclusion
Nous avons formé un modèle, qui est une «régression linéaire», de la Numpy et Scikit Learn sur un ensemble de données pour prédire la réponse de l'ensemble de données, puis nous avons testé ce modèle pour prédire la réponse du nouvel ensemble de données.