Qu'est-ce que la régression de la crête?
Afin d'augmenter la précision de la prédiction, la technique statistique connue sous le nom de régression de la crête réduit l'ampleur des estimations des paramètres. Cela fonctionne particulièrement bien si votre ensemble de données contient des colonnes corrélées que vous essayez d'utiliser comme entrées (variables indépendantes) dans des modèles de régression, mais aucun de vos modèles n'a produit de résultats très précis. En d'autres termes, la régression de la crête est une technique de réglage modèle qui est utilisée pour toute analyse de données multicollinéaires. Les données sont soumises à une régularisation en L2 en utilisant cette méthode.
La fonction de coût de la régression de la crête est:
Min (|| y - x (theta) || ^ 2 + λ || theta || ^ 2)Qu'est-ce que la multicolinéarité?
Le concept de multicolinéarité est basé sur la recherche statistique. Juste au moment où vos variables indépendantes ont un degré de corrélation significatif. La colinéarité n'affecte pas directement la variable de réponse; il concerne plutôt les interactions entre les variables ou les caractéristiques prédictives. Les estimations des coefficients de régression peuvent être inexactes en raison de la multicolinéarité. Il peut potentiellement augmenter les erreurs standard du coefficient de régression et diminuer l'efficacité de tout test t. La multicolinéarité peut fournir des résultats et des valeurs de p trompeurs, augmentant la redondance du modèle et abaissant l'efficacité et la fiabilité de la prévisibilité.
Avantages de la régression de la crête
Implémentation de la régression de la crête dans Sklearn
L'importation nécessite les bibliothèques suivantes:
de Sklearn.linéaire_model Import RidgeCréez l'ensemble de données à l'aide de la commande suivante:
n_sample, n_features = 20, 4Sortir:
Les fonctionnalités sont [[-2.55298982 0.6536186 0.8644362 -0.74216502]Création et ajustement du modèle:
modèle = crête (alpha = 1.0)Conclusion
Nous avons discuté du modèle de régression de la crête dans l'apprentissage automatique qui est utilisé pour effectuer la régularisation L2 sur les données pour empêcher le sur-ajustement. C'est une version avancée d'une simple régression linéaire. Nous avons également discuté de sa mise en œuvre en utilisant Skaran.