Tout au long du traitement et de l'analyse des données, les histogrammes vous soutiennent pour représenter la distribution de fréquence et obtenir facilement des informations. Nous examinerons quelques méthodes différentes pour obtenir une distribution de fréquence dans PostgreSQL. Pour construire un histogramme dans PostgreSQL, vous pouvez utiliser une variété de commandes d'histogramme postgresql. Nous expliquerons chacun séparément.
Initialement, assurez-vous que le shell de ligne de commande PostgreSQL et PGADMIN4 sont installés dans votre système informatique. Maintenant, ouvrez le shell de ligne de commande PostgreSQL pour commencer à travailler sur les histogrammes. Il vous demandera immédiatement de saisir le nom du serveur sur lequel vous souhaitez travailler. Par défaut, le serveur «localhost» a été sélectionné. Si vous n'entrez pas un tout en passant à l'option suivante, il continuera avec la valeur par défaut. Après cela, cela vous incitera à saisir le nom de la base de données, le numéro de port et le nom d'utilisateur sur lequel travailler. Si vous n'en fournissez pas, il continuera avec le par défaut. Comme vous pouvez le consulter à partir de l'image annexée ci-dessous, nous travaillerons sur la base de données «Test». Enfin, entrez votre mot de passe pour l'utilisateur particulier et préparez-vous.
Exemple 01:
Nous devons avoir des tables et des données dans notre base de données sur lesquelles travailler. Nous avons donc créé un «produit» de table dans la base de données «test» pour enregistrer les enregistrements de différentes ventes de produits. Cette table occupe deux colonnes. L'un est «Order_Date» pour enregistrer la date à laquelle la commande a été effectuée, et l'autre est «P_Sold» pour enregistrer le nombre total de ventes à une date particulière. Essayez la requête ci-dessous dans votre coque de commande pour créer ce tableau.
>> Créer un produit de table (ORDAND_DATE DATE, p_sold int);En ce moment, la table est vide, nous devons donc y ajouter des enregistrements. Alors, essayez la commande INSERT ci-dessous dans le shell pour le faire.
>> Insérer dans les valeurs du produit ('2021-03-01', 1250), ('2021-04-02', 555), ('2021-06-03', 500), ('2021-05-04' , 1000), ('2021-10-05', 890), ('2021-12-10', 1000), ('2021-01-06', 345), ('2021-11-07', 467 ), ('2021-02-08', 1250), ('2021-07-09', 789);Vous pouvez maintenant vérifier que le tableau y a des données en utilisant la commande SELECT comme cité ci-dessous.
>> sélectionner * dans le produit;Utilisation du sol et du bac:
Si vous aimez les bacs d'histogramme postgresql pour fournir des périodes similaires (10-20, 20-30, 30-40, etc.), exécutez la commande SQL ci-dessous. Nous estimons le numéro de bac de l'instruction ci-dessous en divisant la valeur de vente par une taille de bac histogramme, 10.
Cette approche a l'avantage de modifier dynamiquement les bacs à mesure que les données sont ajoutées, supprimées ou modifiées. Il ajoute également des bacs supplémentaires pour de nouvelles données et / ou supprime les bacs si leur nombre atteint zéro. En conséquence, vous pouvez générer efficacement des histogrammes dans PostgreSQL.
Plancher de changement (p_sold / 10) * 10 avec plancher (p_sold / 100) * 100 pour augmenter la taille du bac jusqu'à 100.
Utilisation de la clause où:
Vous construirez une distribution de fréquence en utilisant la déclaration de cas pendant que vous comprenez les bacs d'histogramme à générer ou comment les tailles de conteneurs d'histogramme varient. Pour PostgreSQL, ci-dessous est une autre déclaration d'histogramme:
>> Sélectionnez '100-300' comme prix_between, compter (p_sold) comme compter à partir du produit où p_sold entre 100 et 300 Union (sélectionnez '300-600' comme prix_bet, compter (p_sold) comme comptage du produit où p_sold entre 300 et 600 ) Union (sélectionnez '600-900' comme prix_between, compter (p_sold) comme compter à partir du produit où p_sold entre 600 et 900) Union (sélectionnez '900-1300' comme prix_bet, compter (p_sold) comme comptage du produit où p_sold entre 900 Et 1300);Et la sortie montre la distribution de fréquence de l'histogramme pour les valeurs de plage totale de la colonne «p_sold» et le nombre de comptes. Les prix varient de 300 à 600 et 900-1300 ont un nombre total de 4 séparément. La plage de vente de 600-900 a obtenu 2 chefs d'accusation tandis que la plage de 100-300 a obtenu 0 compte de ventes.
Exemple 02:
Voyons un autre exemple pour illustrer les histogrammes dans PostgreSQL. Nous avons créé un tableau «étudiant» en utilisant la commande cité ci-dessous dans le shell. Ce tableau stockera les informations concernant les étudiants et le nombre de numéros d'échec qu'ils ont.
>> Créer une table Student (std_id int, fail_count int);Le tableau doit avoir des données dedans. Nous avons donc exécuté l'insert dans la commande pour ajouter des données dans le tableau «Student» comme:
>> Insérer dans les valeurs des élèves (111, 30), (112, 60), (113, 90), (114, 3), (115, 120), (116, 150), (117, 180), (118 , 210), (119, 5), (120, 300), (121, 380), (122, 470), (123, 530), (124, 9), (125, 550), (126, 50 ), (127, 40), (128, 8);Maintenant, le tableau a été rempli d'une énorme quantité de données selon la sortie affichée. Il a des valeurs aléatoires pour STD_ID et l'échec des étudiants.
>> Sélectionner * chez Student;Lorsque vous essayez d'exécuter une requête simple pour collecter le nombre total d'échecs d'un élève, alors vous aurez la sortie ci-dessous. La sortie affiche uniquement le nombre distinct de dénombrements de défaillance de chaque élève une fois à partir de la méthode «Count» utilisée sur la colonne «std_id». Cela ne semble pas très satisfaisant.
>> SELECT FAIL_COUNT, COUNT (STD_ID) From Student Group par 1 Ordre par 1;Nous utiliserons à nouveau la méthode de plancher dans ce cas pendant des périodes ou des gammes similaires. Alors, exécutez la requête ci-dessous dans le shell de commande. La requête divise les étudiants 'fail_count' par 100.00 puis applique la fonction de plancher pour créer un bac de taille 100. Ensuite, cela résume le nombre total d'étudiants résidant dans cette gamme particulière.
Conclusion:
Nous pouvons générer un histogramme avec PostgreSQL en utilisant l'une des techniques mentionnées précédemment, dépendant des exigences. Vous pouvez modifier les seaux d'histogramme à chaque gamme que vous souhaitez; Les intervalles uniformes ne sont pas nécessaires. Tout au long de ce tutoriel, nous avons essayé d'expliquer les meilleurs exemples pour effacer votre concept concernant la création d'histogramme dans PostgreSQL. J'espère qu'en suivant l'un de ces exemples, vous pouvez créer un histogramme pour vos données dans PostgreSQL.