Tutoriel Python Plotly

Tutoriel Python Plotly
Plotly est une société d'analyse connue pour développer des analyses, des statistiques et des outils graphiques en temps réel pour les applications Web et les scripts Python autonomes. Dans cette leçon, nous examinerons des exemples de base avec des graphiques de données de séries chronologiques simples et intuitives qui seront 100% interactives et pourtant facile à concevoir. Ces graphiques peuvent être utilisés dans les présentations car ils sont entièrement interactifs et prêts à jouer avec.

Il existe également une option pour enregistrer une conception de graphe hors ligne afin qu'ils puissent être exportés facilement. Il existe de nombreuses autres fonctionnalités qui facilitent l'utilisation de la bibliothèque:

  • Enregistrer les graphiques pour une utilisation hors ligne en tant que graphiques vectoriels qui sont hautement optimisés à des fins d'impression et de publication
  • Les graphiques exportés se trouvent au format JSON et non dans le format d'image. Ce JSON peut être chargé dans d'autres outils de visualisation comme Tableau facilement ou manipulé avec Python ou R
  • Comme les graphiques exportés sont de nature JSON, il est pratiquement très facile d'intégrer ces graphiques dans une application Web
  • Plotly est une bonne alternative pour Matplotlib pour la visualisation

Pour commencer à utiliser le package Plotly, nous devons nous inscrire à un compte sur le site Web mentionné précédemment pour obtenir un nom d'utilisateur et une clé API valides avec lesquels nous pouvons commencer à utiliser ses fonctionnalités. Heureusement, un plan de prix libre est disponible pour parce que nous obtenons suffisamment de fonctionnalités pour fabriquer des graphiques de qualité de production.

Installation de l'intrigue

Juste une note avant de commencer, vous pouvez utiliser un environnement virtuel pour cette leçon que nous pouvons être faites avec la commande suivante:

python -m virtualenv
Source Numpy / Bin / Activate

Une fois que l'environnement virtuel est actif, vous pouvez installer une bibliothèque de tracé dans le virtual Env afin que les exemples que nous créons ensuite puissent être exécutés:

PIP installe Plotly

Nous utiliserons Anaconda et Jupyter dans cette leçon. Si vous souhaitez l'installer sur votre machine, regardez la leçon qui décrit «comment installer Anaconda Python sur Ubuntu 18.04 LTS »et partagez vos commentaires si vous rencontrez des problèmes. Pour installer Plotly avec Anaconda, utilisez la commande suivante dans le terminal d'Anaconda:

conda install -c

Nous voyons quelque chose comme ça lorsque nous exécutons la commande ci-dessus:

Une fois que tous les packages nécessaires sont installés et terminés, nous pouvons commencer à utiliser la bibliothèque Plotly avec l'instruction d'importation suivante:

Importer un terrain

Une fois que vous avez fait un compte sur Plotly, vous aurez besoin de deux choses - nom d'utilisateur du compte et une clé API. Il ne peut y avoir qu'une seule clé API appartenant à chaque compte. Alors gardez-le dans un endroit en sécurité comme si vous le perdiez, vous devrez régénérer la clé et toutes les anciennes applications en utilisant l'ancienne clé cesseront de travailler.

Dans tous les programmes Python que vous écrivez, mentionnez les informations d'identification comme suit pour commencer à travailler avec Plotly:

tracer.outils.set_credentials_file (username = 'username', api_key = 'your-api-key')

Commençons avec cette bibliothèque maintenant.

Commencer avec l'intrigue

Nous utiliserons les importations suivantes dans notre programme:

Importer des pandas en tant que PD
Importer Numpy comme NP
Importer Scipy comme SP
Importer un terrain.Plotly comme py

Nous utilisons:

  • Pandas pour lire efficacement les fichiers CSV
  • Numpy pour les opérations tabulaires simples
  • Scipy pour les calculs scientifiques
  • Intraire pour la visualisation

Pour certains des exemples, nous utiliserons les propres ensembles de données de Plotly disponibles sur GitHub. Enfin, veuillez noter que vous pouvez également activer le mode hors ligne pour l'intrigue lorsque vous devez exécuter des scripts de tracé sans connexion réseau:

Importer des pandas en tant que PD
Importer Numpy comme NP
Importer Scipy comme SP
Importer un terrain
tracer.hors ligne.init_notebook_mode (connecté = true)
Importer un terrain.hors ligne comme py

Vous pouvez exécuter l'instruction suivante pour tester l'installation de l'intrigue:

Imprimer (tracer.__version__)

Nous voyons quelque chose comme ça lorsque nous exécutons la commande ci-dessus:

Nous allons enfin télécharger l'ensemble de données avec des pandas et le visualiser comme une table:

Importer un terrain.Figure_factory comme FF
df = pd.read_csv ("https: // brut.githubusercontent.com / tracé / ensembles de données / Master / School_
gains.CSV ")
Tableau = FF.create_table (df)
py.iPLOT (table, filename = 'table')

Nous voyons quelque chose comme ça lorsque nous exécutons la commande ci-dessus:

Maintenant, construisons un Graphique à barres Pour visualiser les données:

Importer un terrain.graph_objs comme Go
données = [aller.Bar (x = df.École, y = df.Femmes)]
py.IPLOT (données, fichier = 'Women-Bar')

Nous voyons quelque chose comme ça lorsque nous exécutons l'extrait de code ci-dessus:

Lorsque vous voyez le graphique ci-dessus avec Jupyter Notebook, vous serez présenté avec diverses options de zoom dans / out sur une section particulière du graphique, de la boîte et de la lasso sélectionnés et bien plus encore.

Graphiques à barres groupés

Plusieurs graphiques à barres peuvent être regroupés très facilement à des fins de comparaison avec. Utilisons le même ensemble de données pour cela et montrons la variation de la présence des hommes et des femmes dans les universités:

Femmes = aller.Bar (x = df.École, y = df.Femmes)
hommes = aller.Bar (x = df.École, y = df.Hommes)
données = [hommes, femmes]
disposition = aller.Disposition (barmode = "groupe")
Fig = aller.Figure (données = données, disposition = disposition)
py.IPLOT (Fig)

Nous voyons quelque chose comme ça lorsque nous exécutons l'extrait de code ci-dessus:

Bien que cela semble bon, les étiquettes dans le coin supérieur n'est pas, correcte! Corrigeons-les:

Femmes = aller.Bar (x = df.École, y = df.Femmes, name = "femmes")
hommes = aller.Bar (x = df.École, y = df.Hommes, name = "hommes")

Le graphique semble beaucoup plus descriptif maintenant:

Essayons de changer le barde:

disposition = aller.Disposition (barmode = "relatif")
Fig = aller.Figure (données = données, disposition = disposition)
py.IPLOT (Fig)

Nous voyons quelque chose comme ça lorsque nous exécutons l'extrait de code ci-dessus:

Graphiques à tarte avec

Maintenant, nous allons essayer de construire un graphique à secteurs avec parce que cela établit une différence fondamentale entre le pourcentage de femmes dans toutes les universités. Le nom des universités sera les étiquettes et les chiffres réels seront utilisés pour calculer le pourcentage de l'ensemble. Voici l'extrait de code pour le même:

Trace = aller.Tarte (étiquettes = df.École, valeurs = df.Femmes)
py.iplot ([trace], filename = 'Pie')

Nous voyons quelque chose comme ça lorsque nous exécutons l'extrait de code ci-dessus:

La bonne chose est que Plotly est livré avec de nombreuses fonctionnalités de zoom dans et hors et de nombreux autres outils pour interagir avec le graphique construit.

Visualisation des données de séries chronologiques avec

Visualiser les données sur les séries chronologiques est l'une des tâches les plus importantes qui se présentent lorsque vous êtes un analyste de données ou un ingénieur de données.

Dans cet exemple, nous utiliserons un ensemble de données distinct dans le même référentiel GitHub que les données antérieures n'ont pas impliqué de données horodatrices spécifiquement. Comme ici, nous allons tracer la variation des actions du marché d'Apple au fil du temps:

Financière = PD.read_csv ("https: // brut.githubusercontent.com / tracé / ensembles de données / maître /
Finance-charts-apple.CSV ")
données = [aller.Disperser (x = financier.Date, y = financier ['AAPL.Fermer'])]
py.IPLOT (données)

Nous voyons quelque chose comme ça lorsque nous exécutons l'extrait de code ci-dessus:

Une fois que vous survolez votre souris sur la ligne de variation du graphique, vous pouvez spécifiquement les détails du point:

Nous pouvons utiliser des boutons Zoom Ont and Out pour voir des données spécifiques à chaque semaine également.

Graphique OHLC

Un graphique OHLC (Open High Low Close) est utilisé pour montrer la variation d'une entité à travers une période. C'est facile à construire avec Pypllot:

à partir de Datetime Import Datetime
open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
high_data = [33.1, 36.3, 33.6, 33.2, 34.8]
low_data = [32.7, 32.7, 32.8, 32.6, 32.8]
close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
Dates = [DateTime (année = 2013, mois = 10, jour = 10),
DateTime (année = 2013, mois = 11, jour = 10),
DateTime (année = 2013, mois = 12, jour = 10),
DateTime (année = 2014, mois = 1, jour = 10),
DateTime (année = 2014, mois = 2, jour = 10)]
Trace = aller.OHLC (x = dates,
open = open_data,
high = high_data,
Low = Low_data,
close = close_data)
data = [trace]
py.IPLOT (données)

Ici, nous avons fourni quelques exemples de points de données qui peuvent être déduits comme suit:

  • Les données ouvertes décrivent le taux de stock lors de l'ouverture du marché
  • Les données élevées décrivent le taux d'actions le plus élevé atteint tout au long d'une période donnée
  • Les données faibles décrivent le taux d'actions le plus bas atteint tout au long d'une période donnée
  • Les données fermées décrivent le taux de conclusion du stock lorsqu'un intervalle de temps donné était terminé

Maintenant, exécutons l'extrait de code que nous avons fourni ci-dessus. Nous voyons quelque chose comme ça lorsque nous exécutons l'extrait de code ci-dessus:

C'est une excellente comparaison de la façon d'établir des comparaisons de temps d'une entité avec la sienne et de la comparer à ses réalisations élevées et faibles.

Conclusion

Dans cette leçon, nous avons examiné une autre bibliothèque de visualisation, parce que ce qui est une excellente alternative à Matplotlib dans des applications de qualité de production qui sont exposées comme applications Web, Plotly est une bibliothèque très dynamique et riche en fonctionnalités à utiliser à des fins de production, donc c'est définitivement une compétence que nous devons avoir à notre actif.

Trouvez tout le code source utilisé dans cette leçon sur GitHub. Veuillez partager vos commentaires sur la leçon sur Twitter avec @sbmaggarwal et @linuxhint.