Comment installer et utiliser un hochet dans Linux pour créer des algorithmes d'exploration de données complexes

Sarah Roux

Hochet est un outil basé sur l'interface utilisateur graphique qui utilise R courir. Il est utilisé pour l'exploration de données et la visualisation. Rattle fournit certaines fonctionnalités à ses utilisateurs qui leur permettent de construire des rapports d'exploration d'analyse des données, de transmuter les données afin qu'elle puisse être exécutée via différents modèles statistiques et mathématiques, construire des modèles d'apprentissage automatique non supervisés et supervisés pour les données et afficher les résultats dans un visuel, manière intuitive. Ces résultats peuvent être affichés dans des graphiques, des graphiques et des tracés dimensionnels variables.

Tout cela est fait en utilisant le noyau R fonctionnalité du cadre. Rattle convertit toutes les actions que vous entreprenez dans son interface graphique en un script R exécuté par l'installation R sous-jacente. C'est ainsi que Rattle peut réaliser toutes ses puissantes fonctionnalités d'analyse de données.

Installation

À installer Hochet Sur votre machine Linux, vous aurez besoin d'un wrapper de gestionnaire de packages spéciaux qui pourra télécharger et installer toutes les dépendances de Rattle sur votre machine. C'est le wajig Outil pour Linux, qui agit comme un wrapper autour de la valeur par défaut apte et dpkg Gestionnaires de package. Il a fourni une utilité facile à APT et DPKG et a ajouté des fonctionnalités au-delà de ces deux gestionnaires de packages.

1. Nous allons commencer par installer wajig En exécutant la commande suivante dans le terminal:

$ sudo apt-get install wajig

Vous devriez voir une sortie terminale similaire à ceci:

2. Nous allons maintenant ajouter des référentiels logiciels à l'aide d'archives de packages personnels (PPA) qui contiennent les dépendances nécessaires pour exécuter un hochet.

Les PPA sont des référentiels logiciels et d'applications conçus pour fonctionner sur des machines Linux. Ceux-ci permettent aux développeurs de distribuer des logiciels créés en utilisant le lien vers le référentiel.

Exécutez les commandes suivantes:

$ wajig addepo ppa: marutter / rrutt4.0

$ wajig addepo ppa: c2d4u.équipe / c2d4u4.0+

3. Nous mettrons à jour le wajig Liste des sources de référentiel local afin que les référentiels logiciels que nous avons ajoutés précédemment puissent être découverts par le gestionnaire de packages et par la suite téléchargé et installé.

Exécutez la commande suivante:

$ wajig Distupgrade

4. Depuis que Rattle utilise R et r-cran Pour s'exécuter avec succès, nous installerons ceux qui utilisent le gestionnaire de packages Wajig. Nous installerons également d'autres dépendances avec les packages R susmentionnés.

Exécutez la commande suivante:

$ wajig installer libgtk2.0-DEV R-Base-DEV R recommandé

Vous devriez voir une sortie similaire à l'image suivante dans votre terminal:

5. Avec R Maintenant installé, nous allons l'exécuter et installer Hochet de l'intérieur r.

Exécutez la commande suivante pour exécuter R:

$ R

Vous devriez voir une invite R similaire ouvrir dans votre terminal:

6. Nous allons maintenant installer le Hochet Package à partir de R en exécutant les commandes suivantes:

> Installer.packages ("hochet")

Vous devriez voir une sortie de terminal similaire:

Si la commande précédente ne fonctionne pas pour vous, essayez la commande suivante:

> Installer.packages ("https: // accéder.togaware.com / rgtk2_2.20.36.2.le goudron.gz ", repos = null)

> Installer.packages ("rgtk2")

7. Une fois les deux commandes téléchargées et installées, nous pouvons charger le Hochet Package dans la bibliothèque R.

Exécutez la commande suivante dans l'invite R:

> bibliothèque (hochet)

8. Avec Hochet chargé dans le R bibliothèque, nous pouvons l'exécuter en exécutant la commande suivante dans l'invite R:

> Rattle ()

Vous devriez voir une instance de hochet s'ouvrir sur votre machine Linux.

Mode d'emploi

On peut utiliser Hochet Pour configurer notre routine d'exploration de données en fonction de nos exigences. Comme vous pouvez le voir dans l'image ci-dessus, il existe différentes options que vous pouvez configurer.

Dans le Données Onglet, nous pouvons sélectionner différents formats de fichiers de données, y compris les fichiers de valeur séparés par des virgules, les fichiers texte, les bases de données ouvrir et même les données contenues dans les scripts. Cela permet à Rattle de saisir les données sous n'importe quelle forme dont nous avons besoin.

Après l'importation des données, nous pouvons visiter le Transformer onglet pour apporter des modifications à nos données. Nous pouvons sélectionner des catégories uniques ou multiples dans nos données et faire des transformations en fonction de nos besoins. Nous pouvons rapidement réaliser des choses en sélectionnant les boutons radio en haut et en réorganisant les données en fonction de la priorité ou du rang que nous attribuons. Nous pouvons normaliser les données en la mise à l'échelle en fonction de certaines plages que nous fournissons, ou nous pouvons augmenter les valeurs manquantes en plaçant la valeur moyenne, minimale ou maximale trouvée dans une catégorie.

Ce ne sont que des choses que nous pouvons faire avec le Hochet Outil de GUI.

Conclusion

Rattle est un outil d'exploration de données très populaire qui continue de croître en popularité en raison de son interface utilisateur graphique facile à utiliser. Il ne nécessite aucun type de code à être écrit et peut simplement être utilisé en interagissant avec son interface d'application. Les chercheurs, les étudiants et les programmeurs du monde entier l'utilisent pour répondre à leurs exigences d'exploration de données. Étant donné que Rattle fournit un backend R très sophistiqué, il peut atteindre des exigences de science des données statistiques et analytiques complexes en quelques clics de souris.

Ronte. Le Rattle est fortement recommandé par les analystes de données juniors et experts dans le monde en raison de sa capacité innée pour aider à créer certains des pipelines d'exploration de données les plus puissants utilisés aujourd'hui.

Python

Histogramme Matplotlib 2D

À Python, le «PLT.Hist2d () La fonction du module pyplot dans la bibliothèque Matplotlib est utilisé...

Ines Dubois

Comment créer un cadre de données vide R

Tutoriel sur les différentes approches pour créer une dataframe vide à l'aide des données.Fonction (...

Lena Dupuy

golang

Introduction au langage de programmation de Golang

Golang est un langage de programmation open source développé par Google. Suivez cet article pour app...

Nathan Blanc