Lorsqu'aucune donnée n'est disponible avec un ou plusieurs modules ou pour une unité entière, il est reconnu comme des données perdues. Dans les environnements quotidiens, les valeurs manquantes sont un problème le plus important. Les entrées NA (non disponibles) sont utilisées pour représenter les enregistrements manquants dans R. De nombreux ensembles de données sont disponibles dans DataFrame avec des valeurs manquantes car elles existent soit mais n'ont pas été acquises ou parce qu'elles n'ont jamais existé."
Comment se débarrasser des valeurs NA dans le langage de programmation R dans Ubuntu 20.04?
Le symbole NA est utilisé dans R pour signifier les valeurs manquantes (non disponibles). NA peut indiquer des valeurs vides dans les colonnes de dataframe dans le langage de programmation R. Nous examinerons comment nous débarrasser des lignes NA dans une colonne de cet article.
Exemple n ° 1: l'utilisation est.Méthode na pour éliminer Na dans R dans Ubuntu 20.04
Nous pouvons utiliser est.na pour éliminer ces valeurs NA du vecteur. Les valeurs NA sont obtenues en utilisant.na () et l'indice vectoriel. Toutes les valeurs sauf Na seront renvoyées par.n / A().
Dans l'exemple ci-dessus, nous avons une représentation vectorielle où certains nombres aléatoires sont inclus avec les valeurs NA. La sortie a également généré la valeur NA. Ainsi, nous voulons les retirer. Pour cela, nous avons appelé le V1 à l'intérieur de la fonction.NA, qui éliminera toute l'existence de valeurs NA dans les vecteurs. La sortie de cette fonction affiche uniquement le numéro.
Exemple n ° 2: Utilisation du na.Méthode RM pour éliminer Na dans R dans Ubuntu 20.04
En évaluant la somme, la moyenne et la variance, nous pouvons également supprimer les valeurs NA. Puis un.RM est une méthode qui est utilisée pour se débarrasser de Na. Si na.rm = true, na est ignoré; Si na.rm = false, na est considéré.
Donc, à commencer par la création de la collection vectorielle, qui a certains nombres et valeurs NA. Cette collection vectorielle est stockée à l'intérieur de la variable VEC. Ensuite, ces valeurs NA sont d'abord supprimées en évaluant la variance représentée comme var. Ensuite, nous avons évalué la somme et signifions sur le VEC pour éliminer les valeurs NA. Notez que nous avons na.RM réglé sur true, ce qui évitera NA dans le vecteur.
Exemple n ° 3: Utilisation de la méthode omit pour supprimer Na dans R dans Ubuntu 20.04
La méthode omit () élimine directement les valeurs NA, le renvoi des valeurs non Na et des index de valeurs NA rejetés en conséquence. C'est le choix le plus simple. Puis un.La méthode omit () renvoie le résultat sans aucune valeur NA dans aucune des lignes. Dans la langue R, c'est la technique la plus rapide pour éliminer les lignes de NA.
Ici, nous avons initialisé les entiers variables avec les vecteurs. Ensuite, avec la commande d'impression, nous avons généré la sortie des vecteurs. Donc, dans la sortie, nous avons vu des valeurs NA. Pour éliminer ces Na du vecteur, nous avons le na.omettre la fonction, qui prend la variable entiers comme entrée pour supprimer les valeurs NA. Après cela, nous avons vérifié dans l'énoncé d'impression si les valeurs NA sont supprimées des vecteurs. Lorsque l'ID de sortie est généré, il ne montre aucune valeur NA dans les entiers.
Exemple n ° 4: Utilisation du complet.Méthode des cas pour éliminer Na dans R dans Ubuntu 20.04
Pour divers types d'analyse des données dans le langage informatique R, une trame de données détaillée sans aucune valeur manquante est requise. Le complet.La méthode des cas obtiendra ceci. Cette fonction R examine une trame de données et renvoie un vecteur de résultat des valeurs manquantes dans les lignes.
Comme dans l'exemple précédent, nous avons des représentations vectorielles. Maintenant, nous éliminons les valeurs NA des cadres de données. Pour cela, nous avons créé le cadre de données à l'intérieur desquels, pour chaque colonne, nous avons inséré certaines valeurs NA. Ensuite, nous avons appelé le complet.Fonction de cas qui prend la trame de données comme une option d'entrée. La Data2 contient cette opération qui est imprimée et montre que les valeurs NA sont supprimées.
Exemple n ° 5: Utilisation de la méthode de rangée pour supprimer Na dans R dans Ubuntu 20.04
R a la méthode intégrée Rowsums, qui génère les sommes pour chaque ligne de la collecte de données au format de Rowsums (X). Des paramètres supplémentaires peuvent être spécifiés, dont le plus significatif est l'argument booléen de Na.RM, qui demande à la fonction de sauter les valeurs NA.
Après avoir créé la trame de données à l'intérieur des données variables, nous avons appliqué la méthode des Rowsums. Dans la rangée, nous avons.Méthode NA et méthode NCOL. Notez qu'il supprime uniquement les valeurs NA de troisième rangée. Comme les autres lignes contiennent également les valeurs NA.
Exemple # 6: Utilisation de la méthode du filtre pour supprimer NA dans R dans Ubuntu 20.04
Nous pouvons également utiliser le package DPLYR TIDYVERS. Ensuite, nous pouvons utiliser une combinaison de la fonction filtrante du pack.Fonction NA. Nous vous montrerons comment supprimer uniquement les lignes dans lesquelles toutes les entrées de données sont na.
En utilisant le package DPLYR pour la fonction de filtre, nous avons créé la trame de données. Ensuite, nous avons appliqué la fonction filtrante de cette trame de données et affiché la sortie, qui a supprimé les valeurs NA de la troisième ligne.
Conclusion
Nous avons appris à supprimer le NA du langage R qui apparaît unique ou plusieurs fois dans les vecteurs ou le cadre de données à ce stade de la session. Nous avons couvert six méthodes qui nous aident à supprimer le NA des données données. Ces méthodes sont assez faciles à mettre en œuvre dans le langage de script R, ce qui peut également supprimer les valeurs NA des lignes et des colonnes. De plus, certaines méthodes ont nécessité le package r dplyr pour éliminer le na.