MongoDB trouve des doublons

MongoDB trouve des doublons
«Avez-vous déjà entendu parler du concept de duplication de données tout en travaillant dans des bases de données? Lorsqu'un enregistrement, une chose, une personne ou un lieu ont sa copie exacte, cette copie est celle du double de l'original. Tout en travaillant dans des bases de données traditionnelles, nous utilisons la clause WHERE pour découvrir les doublons dans les enregistrements du tableau, je.e., SQL, PostgreSQL. D'un autre côté, MongoDB ne vous permet pas d'utiliser la clause WHERE pour découvrir les doublons insérés dans les collections d'une base de données spécifique.

Il est venu avec la fonction agrégée pour découvrir les valeurs en double de la collection. Dans cet article aujourd'hui, nous discuterons de l'insertion des enregistrements en double dans les collections Mongo DB et les afficher sur le shell MongoDB en utilisant la commande globale des collections. Commençons par notre article d'aujourd'hui par l'utilisation des instructions de mise à jour et de mise à niveau de l'APT dans le shell terminal de l'Ubuntu 20.04 Système. Pour cela, vous devez vous connecter d'abord et ouvrir la coque en utilisant «Ctrl + Alt + T."Après cela, vous pouvez essayer les instructions de la croisement affichées sur votre shell et ajouter le mot de passe pour que l'utilisateur continue le processus de mise à jour."

Cela pourrait nécessiter votre confirmation pour poursuivre ce processus. Appuyez sur «Y» en demandant: «Voulez-vous continuer?". Après cela, appuyez sur la touche Entrée.

Cela peut prendre plus ou moins de temps pour traiter en fonction de la situation de votre système.

Après la mise à jour complète, vous obtiendrez les dernières lignes de traitement à faire afficher.

Après la mise à jour et la mise à niveau du système réussi, nous devons ouvrir le shell MongoDB pour insérer certaines collections et enregistrements dans la base de données. Donc, nous avons utilisé la requête «Mongo» pour le faire, comme affiché dans l'image. La coquille a été préparée avec succès.

En utilisant l'instruction «DB» sur le shell MongoDB, nous avons constaté que la base de données «Test» est disponible pour notre usage.

Par conséquent, nous utilisons la base de données «Test» pour d'autres requêtes et créant une collection à l'intérieur. Pour cela, essayez l'instruction «Utiliser» suivie du nom d'une base de données, je.e., "test."

Pour ajouter des enregistrements, nous avons besoin d'une collection dans la base de données de test. Ainsi, nous devons créer une nouvelle collection. Pour cela, nous devons essayer l'instruction «db» avec la fonction «createCollection ()» de MongoDB, suivie du nom d'une nouvelle collection dans sa parenthèse, i.e., Données. La requête a réussi et la collection a été créée avec succès selon le statut «OK: 1». De plus MongoDB, nous avons tendance à utiliser la fonction Find () précédée du nom de la collection pour afficher les enregistrements d'une collection spécifique. Par conséquent, nous avons essayé l'instruction «db» suivie du nom de la collection, je.e., Données, et la fonction trouve () pour le faire. La collection «données» est vide en ce moment. Ainsi, nous devons ajouter des enregistrements à la collection.

Pour insérer les enregistrements dans la collecte de données de MongoDB, nous devons essayer la fonction insert () dans l'instruction «db» ainsi que les données sous forme de documents, i.e., format de liste. Nous utilisons un total de 4 colonnes pour les données de document des collections, i.e., _id, titre, âge et prix. Nous avons ajouté un total de 5 enregistrements pour toutes ces 4 colonnes de collecte de données.

L'enregistrement a été ajouté avec succès selon la sortie ci-dessus montre le nombre d'enregistrements 5 pour l'option «Ninserted». Après cela, nous utiliserons la fonction Find () avec la collection «Data» pour trouver et afficher tous les enregistrements de cette collection. Nous ne transmettons aucun argument à la parenthèse d'une fonction find () pour ne pas restreindre les enregistrements de collecte. Les 5 enregistrements pour la collecte de données ont été présentés dans le Shell Mongo DB.

Comme nous avons traité le thème de la recherche des doublons dans les collections de MongoDB, nous devons également avoir des enregistrements en double dans les collections. Par conséquent, nous avons inséré trois autres enregistrements au sein de la collecte de données à utiliser comme doublons de certains des enregistrements déjà insérés. Nous devons mettre à jour la colonne «_id» uniquement car l'ID de n'importe quelle colonne doit être unique dans MongoDB comme nous le faisions dans les bases de données traditionnelles. La même fonction d'insertion a été utilisée jusqu'à présent avec le nom de collecte «Data». Les trois enregistrements ont été ajoutés.

Maintenant, lorsque vous exécutez l'instruction «DB» avec le nom de collection «Données» suivie de la fonction find () sur le shell MongoDB, le total de 8 enregistrements sera affiché sur votre écran. Nous pouvons voir les valeurs en double pour des colonnes autres que «_id» dans ces données de collecte.

Il est temps d'essayer la méthode Aggregate () pour la collection «Data» afin d'énumérer les valeurs de colonne spécifiques qui y sont dupliquées. Vous devez utiliser la syntaxe de folie affichée d'une commande d'agrégat dans MongoDB. L'option «Group $» est utilisée pour ajouter toutes les valeurs en double d'une colonne spécifique en une, tandis que l'option $ correspond sera utilisée pour découvrir les groupes ayant plus d'un document. D'un autre côté, l'option «PROJET $» sera utilisée pour spécifier le format d'affichage des enregistrements en double. Le premier champ de l'option «Group $» spécifiera le nom de la colonne dans lequel nous rechercherons des doublons. Un total de 3 enregistrements ont été trouvés dupliqués pour la colonne «titre» d'une collecte de données. Après cela, la même requête a été jugée pour la colonne «Age» et a repris les 3 résultats.

Conclusion

L'explication des enregistrements en double a été donnée dans le paragraphe d'introduction, et nous avons discuté de la différence entre découvrir les doublons des bases de données traditionnelles et MongoDB. À cette fin, nous avons essayé de donner une illustration sur la fabrication d'une nouvelle collection dans MongoDB et d'insérer des enregistrements. De plus, nous avons discuté de l'utilisation de la fonction agrégée pour découvrir la colonne spécifique contenant la valeur en double dans les collections. Cet article a affiché la différence claire dans la découverte des doublons pour MongoDB en comparaison avec toute autre base de données.