Python数据可视化的3大步骤.docx
《Python数据可视化的3大步骤.docx》由会员分享,可在线阅读,更多相关《Python数据可视化的3大步骤.docx(12页珍藏版)》请在第一文库网上搜索。
1、Python数据可视化的3大步骤目录?用哪些库来画图?1?matplotlib1?Seaborn1?其他库2?本篇文章主要使用matplotlib进行案例分析2? ?第一步:确定问题,选择图形2? ?第二步:转换数据,应用函数3?第三步:参数设置,一目了然3?可视化作图基础3?MatPIOtIib 作图基础3?Figure 和 Subplot3?颜色 COlOr, 标记 marker, 和线型 IineStyIe5?刻度,标签和图例5?设置标题,轴标签,刻度以及刻度标签6?添加图例7?注解8?保存图表到文件8?Pandas中的绘图函数8? ?MatPlOtIib 作图8? ?线型图8? ?Se
2、ries.ptot 方法的参数9?DataFrame.pbt 方法的参数10?柱状图10用哪些库来画图?matplotlibPython中最基本的作图库就是matplotlib,是一个最基础的Python可视化库,一般都 是从matplotlib上手Python数据可视化,然后开始做纵向与横向拓展。Seaborn是一个基于matplotlib的高级可视化效果库,针对的点主要是数据挖掘和机器学习中的 变量特征选取,Seabom可以用短小的代码去绘制描述更多维度数据的可视化效果图。其他库Bokeh (是一个用于做浏览器端交互可视化的库,实现分析师与数据的交互);Mapbox (处理地理数据引擎更强
3、的可视化工具库)等等。本篇文章主要使用matplotlib进行案例分析国翻第一步:确定问题,选择图形业务可能很复杂,但是经过拆分,我们要找到我们想通过图形表达什么具体问题。分析 思维的训练可以学习麦肯锡方法和金字塔原理中的方法。这是网上的一张关于图表类型选择的总结。如何选择图表的类型?在Python中,我们可以总结为以下四种基本视觉元素来展现图形:点:SCatterPIot二维数据,适用于简单二维关系;线:IinePIOt二维数据,适用于时间序列;柱状:bar plot二维数据,适用于类别统计;颜色:heatmap适用于展示第三维度;数据间存在分布,构成,比较,联系以及变化趋势等关系。对应不一
4、样的关系,选择相 应的图形进行展示。画翻第二步:转换数据,应用函数数据分析和建模方面的大量编程工作都是用在数据准备的基础上的:加载、清理、转换 以及重塑。我们可视化步骤也需要对数据进行整理,转换成我们需要的格式再套用可视化方 法完成作图。下面是一些常用的数据转换方法:合并:merge, concat, COmbine_frist(类似于数据库中的全外连接)重塑:reshape;轴向旋转:PiVOt (类似excel数据透视表)去重:drop_duplicates映射:map填充替换:flllna,replace重命名轴索引:rename将分类变量转换哑变量矩阵的get_dummies函数以及在
5、df中对某列数据取限定值等 等。函数则根据第一步中选择好的图形,去找Python中对应的函数。国翻第三步:参数设置,一目了然原始图形画完后,我们可以根据需求修改颜色(COk)r),线型(IineStyIe),标记(maker) 或者其他图表装饰项标题(Title),轴标签(xlabel, ylabel),轴刻度(set,xticks),还有 图例(legend)等,让图形更加直观。第三步是在第二步的基础上,为了使图形更加清晰明了,做的修饰工作。具体参数都可以 在制图函数中找到。可视化作图基础Matplotlib作图基础#导入包import numpy as npimport pandas as
6、 pdimport matplotlib.pyplot as pitFigure 和 Subplotmatplotlib的图形都位于FigUre (画布)中,SUbPIot创建图像空间。不能通过figure绘图,必须用add_subplot创建一个或多个Subplotofigsize可以指定图像尺寸。#创建画布fig=plt.figure()# 创建subplot, 221表示这是2行2列表格中的第1个图像。axl=fig.add.subplot(221)# 但现在更习惯使用以下方法创建画布和图像,2,2表示这是一个2*2的画布,可以放置 4个图像fg,axes=plt.subplots(2,
7、2,sharex=True,sharey=True)#plt.subplot的sharex和sharey参数可以指定所有的subplot使用相同的x, y轴刻度。I PID 112 Q4 QO QB 1.0plots_adjust方法可以调整 t=None,bottom=None,right =None,hspace=None)D Q2 Q4 QU TI-B 1: 旬距。=None,颜色 color,标记 marker,和线型 linestyleHiatplotlib的plot函数接受一组X和Y坐标,还可以接受一个表示颜色和线型的字符串 缩写:*g-,表示颜色是绿色green,线型是J虚线。*
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 数据 可视化 步骤
