天天看点

Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

点击上方 "程序员小乐"关注, 星标或置顶一起成长

每天凌晨00点00分, 第一时间与你相约

每日英文

Good friends are like stars. You don’t always see them, but you know they’re always there. 

好朋友就像是星星。你不一定总是能见到他们,但你知道,他们会一直在那里。

每日掏心话

人的一生难免会遇到各种各样的沟沟坎坎,身在局中,你会以为自己过不去了。

来自:公众号 读芯术 | 责编:乐乐

Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

程序员小乐(ID:study_tech)第 937 次推文  图源:百度

往日回顾:有个程序员老公有多爽???

   正文   

流行 Python 数据分析库 Pandas 中的绘图功能一直是迅速绘制图表的首选之一。但是,其可用的可视化效果总是十分粗略,实用有余、美观不足。

笔者常用 Pandas 的绘图功能快速地执行一些可视的数据探索,但在介绍数据洞察时,我会使用“更美观”的绘图库(如 Plotly 或 Bokeh )来重做可视化。

自最新的 Pandas 版本0.25.3发布后,无需这样做了,现在我们可以使用第三方可视化库作为 Pandas 绘图功能的后端。Plotly是一款基于 web 实现交互式可视化的流行Python库,其最近发布了 Pandas绘图后端。

来看看如何使用 Plotly 和 Bokeh 后端创建更丰富的可视化效果。

Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

使用不同的后端

想要激活绘图功能的不同后端需在导入 pandas 后,添加此行代码:

pd.options.plotting.backend =  plotly
           

当前可用的后端有:

·        Plotly

·        Holoviews

·        Matplotlib

·        Pandas _bokeh

·        Hyplot

Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

Plotly后端

Plotly是一个 Python库,其支持丰富的交互式可视化效果。Plotly包的好处之一在于它是在库的 Javascript 版本之上构建的,这意味着图表会基于Web,可以显示为 HTML 文件或嵌入到基于Python的Web应用程序中。用户还可以将可视化内容下载为高质量的图像文件,以便在文档或论文中使用。

下面来浏览一些Plotly作为Pandas绘图后端的快速示例。

如果还没有安装Plotly ,则需要使用pip intsall plotly来安装。如果是在Jupyterlab中使用 Plotly ,则需要额外执行几个安装步骤来显示可视化效果。首先,安装IPywaidgets:

pipenv install jupyterlab " ipywidgets>=7.5"pip install jupyterlab "ipywidgets>=7.5"
           

然后运行以下命令以安装Plotly扩展:

jupyter labextension install [email protected]
           

为了说明绘图后端的用法,使用openml.org名为“wine(葡萄酒)”的数据集。

import pandas as pd      import numpy as np             from sklearn.datasets import fetch_openml             pd.options.plotting.backend = plotly              X,y =fetch_openml("wine", version=1, as_frame=True, return_X_y=True)      data = pd.concat([X,y], axis=1)      data.head()
           

该数据集由各类葡萄酒的多个特征和相应的标签组成。下图显示了数据集的前几行。

Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

绘图功能的工作方式与标准Pandas绘图功能的工作方式大致相同,只是现在可视化效果同Plotly一样丰富。下面的代码绘制了数据集中两个特征之间的关系。

fig = data[[ Alcohol ,  Proline ]].plot.scatter(y= Alcohol , x= Proline )                                      fig.show()
           
Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端
Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

可以通过组合 Pandas 的groupby函数创建一个柱状图来总结类之间的平均色调差异:

data[[ Hue , class ]].groupby([ class ]).mean().plot.bar()
           
Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

将类添加到之前创建的散点图中。使用Plotly,可以轻松地给每个类使用不同的颜色,以便直观地区分:

fig = data[[ Hue ,  Proline ,  class ]].plot.scatter(x= Hue , y= Proline , color= class , title= Proline and Hue by wine class )                                fig.show()
           
Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端
Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

Bokeh 后端

Bokeh 也可以提供丰富交互式可视化效果。其可视化图表可以在 Web 浏览器中查看,嵌入到 Web应用程序中或用于创建交互式仪表板。Bokeh 甚至有一个流式 API,可以为流数据(如金融市场数据)创建实时可视化图表。

库可以通过pip来安装:

pip install pandas-bokeh 
           

要在 Jupyterlab中显示 Bokeh的可视化效果,需要安装两个新的扩展:

jupyter labextension install @jupyter-widgets/jupyterlab-managerjupyterlabextension install @bokeh/jupyter_bokeh
           

使用 Bokeh 后端重新创建之前的散点图:

pd.options.plotting.backend = pandas_bokeh              import pandas_bokeh                            from bokeh.io import output_notebook                            from bokeh.plotting import figure, show             output_notebook()                            p1= data.plot_bokeh.scatter(x= Hue ,                                                          y= Proline ,                                                          category= class ,                                                          title= Proline and Hue by wine class ,                                                          show_figure=False)                            show(p1)
           

可视化效果如下:

Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

Bokeh 有一个plot_grid函数,可为多个图表创建仪表板式布局。下面的代码在网格布局中创建四个图表:

output_notebook()             p1 = data.plot_bokeh.scatter(x= Hue ,                                               y= Proline ,                                               category= class ,                                               title= Proline and Hue by wine class ,                                               show_figure=False)                                      p2 = data[[ Hue , class ]].groupby([ class ]).mean().plot.bar(title= Mean Hue per Class )             df_hue = pd.DataFrame({                      class_1 : data[data[ class ] == 1 ][ Hue ],                      class_2 : data[data[ class ] == 2 ][ Hue ],                      class_3 : data[data[ class ] == 3 ][ Hue ]},                     columns=[ class_1 ,  class_2 ,  class_3 ])             p3 = df_hue.plot_bokeh.hist(title= Distribution perClass: Hue )             df_proline = pd.DataFrame({                      class_1 : data[data[ class ] == 1 ][ Proline ],                      class_2 : data[data[ class ] == 2 ][ Proline ],                      class_3 : data[data[ class ] == 3 ][ Proline ]},                     columns=[ class_1 ,  class_2 ,  class_3 ])             p4 =df_proline.plot_bokeh.hist(title= Distribution per Class: Proline )             pandas_bokeh.plot_grid([[p1, p2],                                         [p3, p4]], plot_width=450)
           
Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

为内置的Pandas绘图功能添加多个第三方后端,这大大增强了该库用于数据可视化的能力。从此之后,pandas就可以集美貌与实用于一身啦。

Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端

欢迎在留言区留下你的观点,一起讨论提高。如果今天的文章让你有新的启发,欢迎转发分享给更多人。欢迎加入程序员小乐加群”或者“阿里、腾讯、百度、华为、京东最新面试题汇集

学习 MySQL 高性能优化原理,这一篇就够了!

Spring Boot 最最最常用的注解梳理

是什么让我放弃了Restful API?

Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端
关注订阅号「程序员小乐」,收看更多精彩内容
           

嘿,你在看吗?

Pandas万花筒:让绘图变得更美观使用不同的后端Plotly后端Bokeh 后端