Le codage chaud fait référence à la conversion de données catégorielles en modèles que les algorithmes d'apprentissage automatique peuvent utiliser. Dans la plupart des cas, cela implique de convertir chaque valeur de catégorie en une valeur binaire de 1 ou 0.
L'image ci-dessous illustre un codage à un hot.
Source: Kaggle
Vous pouvez explorer un codage à un hot dans la ressource ci-dessous:
https: // en.Wikipédia.org / wiki / un hot
Échantillons de données
Commençons par créer des exemples de données. Tout d'abord, utilisez l'exemple de code comme indiqué ci-dessous:
Importer des pandas en tant que PDImportez un OneHotencoder de Sci-Kit-Learn pour effectuer un codage à un hot pour effectuer un codage à un hot comme indiqué:
de Sklearn.Importation de prétraitementDans l'exemple ci-dessus, nous commençons par importer le OneHotencoder de Sci-Kit-Learn. Nous créons ensuite une instance d'encodeur et passons le paramètre Handle_unknown pour ignorer.
Enfin, nous créons un nouveau DataFrame à partir des données codées. Le code ci-dessus doit renvoyer le nouveau DataFrame comme indiqué:
Vous pouvez également fusionner le Frame de données codé à la Frame de Data d'origine à l'aide de la méthode de jointure comme:
df = df.rejoindre (e_df)Le code ci-dessus doit retourner:
Conclusion
Cet article couvre le minimum de l'exécution d'un codage de base à un hot d'un pandas dataframe à l'aide de la bibliothèque Sci-Kit-Learn.