Qu'est-ce que SVM?
SVM ou Support Vector Machine est une technique d'apprentissage automatique supervisé pour analyser les données de régression et de classification. L'objectif de l'algorithme SVM est de définir la limite ou la ligne de décision optimale qui peut catégoriser l'espace N-dimension, nous permettant de classer les nouveaux points de données dans le futur rapidement. Cette limite de décision est connue comme un hyperplan. Cela permet à votre modèle de trier un ensemble de données étiqueté et de catégoriser l'entrée non étiquetée. C'est l'un des algorithmes d'apprentissage supervisés les plus populaires et est fréquemment utilisé pour classer les images en utilisant les fonctionnalités récupérées par un réseau neuronal convolutionnel profond.
Supposons que vous avez des points linéairement séparables dans votre article qui sont de différentes sortes. Le SVM localisera une ligne droite qui, pour autant que ce soit raisonnablement possible, divise ces points en deux catégories. Imaginez deux paires de points allongés sur un avion. Les premiers sont rouges, tandis que les autres sont bleus. Afin d'optimiser sa distance des deux classes de points, une machine à vecteur de support recherche une ligne qui divise les points rouges des bleus. Ceci est connu comme le La plus grande marge de différence. Il est important de mesurer la distance entre la ligne et les points aux bords des deux points pour déterminer la marge avec la plus grande différence. Ils les appellent Soutenir les vecteurs. Les points doivent être séparables par une ligne car ils doivent être séparés par un. Le terme pour cela est séparabilité linéaire. L'astuce du noyau est un ajout crucial à l'algorithme de machine vectorielle de support pour surmonter cette restriction. Cela déplace les données dans un espace de dimension plus élevée et utilise une fonction linéaire pour le séparer là-bas. À travers un soi-disant noyau, la transformation est réalisée. Ceci est uniquement concevable car le calcul de la fonction linéaire pour séparer les données dépend du produit DOT des vecteurs / points de support. Autrement dit: pour éviter d'utiliser une ligne pour diviser le rouge des points bleus, mélangez-les dans l'avion.
Soulever les rouges, laissant les bleus derrière. Il est maintenant évident que vous pouvez séparer les points en utilisant un avion. La technique du noyau réalise cela. Il modifie les données dans une dimension plus élevée pour être vraisemblablement séparable. Le soulevant a ajouté une troisième dimension (trois dimensions), qui séparait les points par une ligne en trois dimensions, un plan, tandis que les points sur le sol (deux dimensions) n'étaient pas.
Avantages de SVM
Inconvénients de SVM
Implémentation de SVM dans Sklearn
Importation de bibliothèquesSortir
Les données de train sont [[-2.02514259 0.0291022 -0.47494531… -0.33450124 0.86575519Sortir
Les vecteurs de support sont [[-2.02514259 0.0291022 -0.47494531… -0.33450124 0.86575519Conclusion
Nous avons subi l'explication des machines de vecteur de support (SVM) ainsi que leurs avantages, leurs inconvénients et leur implémentation. SVM attire des hyperplans entre les points avec la plus grande marge et peut être utilisé pour les cas de classification et de régression. Nous avons vu comment Sklearn nous fournit un moyen facile d'implémenter SVM et d'obtenir des détails sur les vecteurs de support.