Installez les cahiers Anaconda Python et Jupyter pour la science des données

Installez les cahiers Anaconda Python et Jupyter pour la science des données

Commencer avec Anaconda

Pour expliquer ce qu'est Anaconda, nous citerons sa définition sur le site officiel:

Anaconda est un gestionnaire de packages gratuit et facile à installer, un gestionnaire d'environnement et une distribution Python avec une collection de plus de 1 000 packages open source avec un support communautaire gratuit. Anaconda est autochtone, vous pouvez donc l'utiliser, que vous soyez sous Windows, MacOS ou Linux.

Il est facile de sécuriser et d'étendre tout projet de science des données avec Anaconda car il vous permet de prendre un projet de votre ordinateur portable directement vers le déploiement du cluster. Un ensemble complet de fonctionnalités peut également être affiché ici avec l'image officielle:

Anaconda Enterprise

Pour montrer en bref ce qu'est Anaconda, voici quelques points rapides:

  • Il contient du python et des centaines de packages qui sont particulièrement utiles si vous commencez ou expérimentez avec la science des données et l'apprentissage automatique
  • Il est livré avec Conda Package Manager et des environnements virtuels qui se développent très facile
  • Il vous permet de commencer avec le développement très rapidement sans perdre votre temps à configurer des outils pour la science des données et l'apprentissage automatique

Vous pouvez installer Anaconda à partir d'ici. Il installera automatiquement Python sur votre machine afin que vous n'ayez pas à l'installer séparément.

ANACONDA VS JUPYTER CHARBORS

Chaque fois que j'essaie de discuter d'Anaconda avec des personnes débutantes avec Python et la science des données, ils sont confus entre Anaconda et Jupyter Notebooks. Nous citerons la différence en une seule ligne:

Anaconda est directeur chargé d'emballage. Jupyter est un couche de présentation.

Anaconda essaie de résoudre le dépendance de la dépendance Dans Python-où différents projets ont des versions de dépendance différentes - pour ne pas faire de dépendances différentes, les dépendances nécessitent des versions différentes, ce qui peut interférer les uns avec les autres.

Jupyter essaie de résoudre le problème de reproductibilité dans l'analyse en permettant une approche itérative et pratique pour expliquer et visualiser le code; En utilisant une documentation de texte riche combinée avec des représentations visuelles, dans une seule solution.

Anaconda est similaire à Pyenv, Venv et Minconda; Il est destiné à atteindre un environnement python qui se reproductible à 100% sur un autre environnement, indépendamment des autres versions des dépendances d'un projet disponibles. C'est un peu similaire à Docker, mais limité à l'écosystème Python.

Jupyter est un outil de présentation incroyable pour les travaux analytiques; où vous pouvez présenter du code dans des «blocs», se combine avec des descriptions de texte riches entre les blocs, et l'inclusion de la sortie formatée des blocs, et des graphiques générés dans une affaire bien conçue par le biais du code d'un autre bloc.

Jupyter est incroyablement bon dans le travail analytique pour s'assurer reproductibilité Dans la recherche de quelqu'un, afin que n'importe qui puisse revenir plusieurs mois plus tard et comprendre visuellement ce que quelqu'un a essayé d'expliquer, et voir exactement quel code a conduit quelle visualisation et conclusion.

Souvent, dans le travail analytique, vous vous retrouverez avec des tonnes de cahiers à moitié finis expliquant des idées de preuve de concept, dont la plupart ne mèneront nulle part initialement. Certaines de ces présentations pourraient des mois plus tard, ou même des années plus tard, présentez une fondation à partir de pour un nouveau problème.

Utilisation d'Anaconda et Jupyter Notebook d'Anaconda

Enfin, nous allons jeter un œil à certaines commandes avec lesquelles nous pourrons utiliser Anaconda, Python et Jupyter sur notre machine Ubuntu. Tout d'abord, nous téléchargerons le script d'installation à partir du site Web d'Anaconda avec cette commande:

curl -o -k https: // repo.anaconda.com / archive / anaconda3-5.2.0-LINUX-X86_64.shot

Nous devons également assurer l'intégrité des données de ce script:

sha256sum anaconda3-5.2.0-LINUX-X86_64.shot

Nous obtiendrons la sortie suivante:

Vérifiez l'intégrité d'Anaconda

Nous pouvons maintenant exécuter le script Anaconda:

bash anaconda3-5.2.0-LINUX-X86_64.shot

Une fois que vous avez accepté les termes, fournissez un emplacement pour l'installation de packages ou appuyez simplement sur Entrée pour qu'il prenne l'emplacement par défaut. Une fois l'installation terminée, nous pouvons activer l'installation avec cette commande:

source ~ /.bashrc

Enfin, testez l'installation:

liste des conda

Faire un environnement anaconda

Une fois que nous avons une installation complète en place, nous pouvons utiliser la commande suivante pour créer un nouvel environnement:

conda crée --name my_env python = 3

Nous pouvons maintenant activer l'environnement que nous avons créé:

Source Activer My_env

Avec cela, notre invite de commande changera, reflétant un environnement anaconda actif. Pour continuer à mettre en place un environnement de jupyter, continuez avec cette leçon qui est une excellente leçon sur la façon d'installer des cahiers de jupyter sur Ubuntu et de commencer à les utiliser.

Conclusion: Installez des cahiers Anaconda Python et Jupyter pour la science des données

Dans cette leçon, nous avons étudié comment nous pouvons installer et commencer à utiliser l'environnement Anaconda sur Ubuntu 18.04 qui est un excellent gestionnaire d'environnement à avoir, en particulier pour les débutants pour la science des données et l'apprentissage automatique. Ce n'est qu'une introduction très simple de nombreuses leçons à venir pour Anaconda, Python, la science des données et l'apprentissage automatique. Partagez vos commentaires pour la leçon avec moi ou sur la poignée Twitter de Linuxhint.