Lorsque vous utilisez Python, le type de données variable ne doit pas être indiqué. Une variable reçoit une allocation de mémoire au moment de l'exécution lorsqu'il est donné une valeur. Le module Python Panda est utilisé pour modifier les ensembles de données. Les pandas sont principalement utilisés pour les bibliothèques d'analyse des données. Il donne une variété d'outils et de stratégies pour stimuler l'analyse des faits. Une grande partie des activités longues et fastidieuses impliquées dans le travail avec les données sont simples par Pandas. Dans cet article, nous utilisons la fonction Merge_asof ().
Méthode Pandas Merge_asof ()
Cette fonction implémente la fusion par distance clé. À l'exception de la correspondance sur la touche la plus proche plutôt que des clés égales, ceci est comparable à une «gauche à gauche». Il a deux fonctions principales, qui sont «en avant» et «arrière». Une recherche «avant» est utilisée pour sélectionner la première ligne dans le cadre de données pertinent où la clé est supérieure ou équivalente à la clé de gauche. Une recherche «en arrière» est utilisée pour sélectionner la toute dernière ligne dans le cadre de données droit dont la clé est inférieure ou comparable à la clé de gauche.
Il y a beaucoup de choses que nous pourrions vouloir faire après avoir construit ou importé notre cadre de données dans Pandas. Actuellement, nous devons apprendre à effectuer une «jointure de gauche» sur deux cadres de données où les clés de jointure ne correspondent pas également. La clé de jointure doit être utilisée pour commander à la fois les cadres de données gauche et droit. À l'aide de la clé de jointure, les cadres de données gauche et droit doivent être commandés. Les deux principaux paramètres que nous avons utilisés dans cet article sont «à gauche» et «droite."
La syntaxe pour les pandas fusionnent asof
Exemple 1: affichage de la fusion de deux cadres de données en utilisant plusieurs fois la fusion de pandas
Nous allons maintenant discuter de la fusion de deux cadres de données. Les trois méthodes les plus cruciales pour intégrer des données dans les pandas nous ont maintenant été enseignées, qui sont «Merge ()», «Join ()» ou «Concat ()». Dans cet article, nous utiliserons "Merge_asof ()". Comme vous pouvez le voir dans le code, nous avons d'abord importé des Pandas open source. Deux cadres de données que nous avons nommés «à gauche» et «droite». Le cadre de données «gauche» est créé par la source de pandas par «Importer des pandas». La valeur du cadre de données «gauche» est stockée en «M» ayant des valeurs de «2», «6» et «8». Nous les avons déclarés avec «Left_values», où la première valeur est stockée dans «M», la deuxième valeur en «N» et la troisième valeur en «O».
La circonstance identique s'applique à la «bonne» données de données. La variable «M» a stocké des valeurs de «2», «4», «6», «8» et «9». Il est déclaré «droit_values». Après avoir créé nos dataframes, nous les avons affichés à l'aide de la fonction «Imprimer (gauche)» pour le cadre de données «gauche» et la fonction «Imprimer (droite)» pour la trame de données «droite». Ici, nos cadres de données ont été créés.
Maintenant, nous arrivons à notre fonction principale de "Merge_asof ()". Cette fonction sera utilisée pour fusionner ou afficher deux cadres de données ensemble. «Pandas.Merge_asof () "sera utilisé avec la fonction d'impression pour afficher les cadres de données sur le côté gauche ou droit. Dans la dernière partie de notre code, nous avons utilisé le faux état verbeux juste pour l'empêcher de faire correspondre les valeurs les unes avec les autres.
Si nous discutons de la sortie en haut, nous avons affiché «M» avec le nom de la valeur du cadre de données «gauche» avec le nom de «Left_values» et toutes les valeurs sont affichées avec les noms de valeur de variable pour « 2 "comme" M "," 6 "comme" N "et" 8 "comme" O ". Ensuite, affichez les données de la «bonne» trame de données comme le nom de «Right_Values». Juste après la «gauche», ses valeurs pour les numéros d'index sont «2» pour «2», «4» pour «4», «6» pour «6», «8» pour «8» et «9» pour «9».
Lorsque les deux cadres de données sont affichés, nous utilisons les «pandas.Merge_asof () "pour fusionner à la fois les valeurs de la trame de données et les afficher en utilisant la fonction" print () ". Il affiche les valeurs du cadre de données «gauche» et de la trame de données «droite» dans deux colonnes distinctes qui ont les mêmes valeurs de «2», «6» et «8» dans «Left_values» et «droite_values». Le «faux» verbeux n'affichera pas les valeurs qui ne sont pas courantes dans les deux cadres de données.
Exemple 2: Affichage de la fusion de deux cadres de données en utilisant une fonction de fusion pandas asof () une fois
Dans cet exemple, nous discuterons de la façon dont nous utilisons la fonction «merge_asof ()» dans deux cadres de données à la fois. Dans l'exemple ci-dessus, nous avons appliqué la fonction «merge_asof ()» séparément pour chaque trame de données. Maintenant, nous voyons comment nous pouvons combiner deux trames de données dans des colonnes en appliquant la fonction «merge_asof ()» une seule fois. Tout d'abord, nous avons créé nos données et donné les noms de DataFrames comme «MD1» et «MD2» en utilisant des pandas. Pour le dataframe «MD1», nous avons déclaré le nom de la colonne comme «Left_side_value». Les données du cadre de données «MD1» comprennent trois noms, qui sont «Michael», «Shawn» et «Herry». L'indice fourni aux données de «MD1» est «20», «40» et «60». La même chose que les données «MD2», il stocke des données «20», «30», «50», «55» et «59». L'indice donné aux données est également donné la même chose que des données comme «20», «30», «50», «55» et «59».
Après avoir créé nos données, nous avons affiché nos données en utilisant «Print (MD1)» et «Print (MD2)». Maintenant, nous allons discuter de notre fonction principale, la fonction "Merge_asof ()". Après avoir affiché les données dans les deux cadres de données, nous avons appliqué notre fonction principale pour fusionner les deux cadres de données. Avec la fonction "Merge_asof ()", nous avons utilisé Verbose de "true" avec "Left_index = true" et "droite_index = true" juste pour s'assurer qu'il pourrait être comparable à une "joinde gauche" à l'exception que nous correspondre à la touche la plus proche au lieu de clés égales. La clé doit être utilisée pour commander les deux dataframes.
Maintenant, nous allons regarder notre sortie. En haut, nos premières données de renommée de données «MD1» s'affichent avec «Left_side_value» avec les trois numéros d'index dans le coin gauche, et les trois noms de données du côté opposé des numéros d'index sont «Michael», «Shawn», et "Herry". Sur le prochain "droit_side_value" des trames de données "MD2" sont affichées avec les cinq nombres d'index et données. Ensuite, après avoir appliqué notre «imprimé (pandas.Merge_asof (MD1, MD2, Left_index = true, droite_index = true)) ”Fonction principale, il a affiché les données fusionnées de nos deux cadres de données . Crame de données «MD1» dans le coin gauche et cadre de données «MD2» dans le coin droit, ainsi que la correspondance de la clé la plus proche.
Conclusion
Les pandas nous permettent d'effectuer une fusion par distance clé en utilisant la fonction "Merge_asof ()". Pour remplir cette fonction, nous avons utilisé l'outil «Spyder» pour exécuter nos codes respectifs. Expliquons notre article en quelques mots. Le premier exemple utilise deux cadres de données intitulés «gauche» et «droite». D'abord une fonction appliquée séparément avec le cadre de données «gauche», puis dans la trame de données «droite». En conséquence, il fusionne les données étroitement liées des deux cadres de données. Pour cela, nous avons également utilisé la «fausse» instruction de la fonction pour l'empêcher d'être une correspondance exacte. Si nous discutons du deuxième exemple, nous avons utilisé la fonction «Merge_asof ()» pour combiner les deux cadres de données en un seul appel de fonction. Nous avions deux cadres de données qui étaient «MD1» et «MD2».