欢迎来到第一文库网! | 帮助中心 第一文库网-每个人都是第一
第一文库网
全部分类
  • 研究报告>
  • 学术论文>
  • 全科教育>
  • 应用文档>
  • 行业资料>
  • 企业管理>
  • 技术资料>
  • 生活休闲>
  • ImageVerifierCode 换一换
    首页 第一文库网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    数据可视化发展简史.docx

    • 资源ID:77925       资源大小:7.31MB        全文页数:47页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录 微博登录
    二维码
    扫码关注公众号登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据可视化发展简史.docx

    数舸视化发展简史目录目录1编者按2引言21 .为什么要数据可视化Necessity for data visualization32 . 什么是数据可视化Concept of data Visualization112.1. 发展历程112.1.1. 17世纪之前图表萌芽112.1.2. 17世纪物理测量122.1.3. 18世纪图形符号142.1.4. 19世纪数据图形152.1.5. 1970S-21世纪交互可视化192.1.6. 2004至今可视分析学213 . 怎么做数据可视化How to visualize data243.1. 可视化流程243.1.1. 获取并清洗数据243.1.2. 理解数据含义&明确目标263.1.3. 选择合适的展现形式273.2. 可视化 Check List333.2.1. 过度设计影响信息表达333.2.2. 图表类型不合适353.2.3. 使用过多的色彩373.2.4. 避免信息过载393.2.5. 少用3D效果413.2.6. 眯眼测试,突出重点434 .结语455 .后记45参考资料45编者按数据可视化是数据分析最常见的一种应用形式,本文介绍了数据可视化的发展历史和应用现状。引言John Snow(不是G.O.T.里那个“私生子”)大概永远不会想到,自己在排查霍乱传播途径时,在地图上标记死于霍乱病人的“霍乱地图”居然会被后人评为历史上十佳数据可视化的案例,并且成为了医药地理学和传染病学中一项基本的研究方法。约翰斯诺(John Snow, 1813年3月15日1858年6月16 H),英国内科医生,曾经当过维多利亚女王的私人医师,因在1854年宽街霍乱爆发事件研究中作出重大贡献,被认为是麻醉医学和公共卫生医学的开拓者。guy:Not this guy.Snow在斯诺生活的年代,对霍乱的起因的主流意见是空气污染论(认为霍乱像黑死病一样通过空气传播)。另一方意见是未被广泛接受病菌学说。通过深入研究,在与当地居民的沟通中加上亨利怀特海德的协助,斯诺判断出宽街的公共水泵是污染源,斯诺随后使用点示图去解释霍乱案例爆发点是以水泵为中心。通过连接霍乱事件与地理信息的关联,创制了著名的“霍乱地图”。他将该地区的每一个水泵,以及四周的水井都标注到图中。最后他发现最多的霍乱患者围绕的水泵位于宽街。新冠疫情肆虐期间,大家每天查看的疫情地图,都得感谢祖师爷斯诺的贡献。回到本文的主题,关于数据可视化,数据玩家将按经典的Why-What-How逻辑为大家逐步展开。1.为什么要数据可视化Necessity for data visualization先来举个例子,大家可以尝试找出下图中的“7” :第3页共45页904836898902637328783949036822807958069338622253737394349824482395603253366664440742275788572882622485099473556834698000925500345730505406077668830445看累了?试试下面这张图呢?904836898902637328783949036822807958069338622253737394349824482395603253366664440742275788572882622485099473556834698000925500345730505406077668830445是不是容易太多了,这就是视觉的力量。可视化辅助决策研究表明,人眼是一个高带宽大量视觉信号并行GPU,带宽在2.339G/S,相当于一个两万兆网卡,具有超强的模式识别能力,且对可视符号的处理速度比数字或者文本快多个数量级,在大数据时代,数据可视化是人们洞察数据内涵、理解数据蕴藏价值的有力工具。数码金融活题用户上海90后年龄标签性别地域©客户表mm63%37%因此,可视化常常被用来辅助决策,如上图,中间的一张密密麻麻的客户表,到底能得出什么有价值的信息指导决策呢?光看一行行一列列的数据,可能需要很久才能得出一些结论,但是经过可视化,我们可以轻松的以各种形式的可视化快速掌握结论,从而辅助决策。这就是:可视分析,即将信息提炼为知识,起到“观物至知”对作用,便于决策者从复杂、大量、多维度的数据中快速挖掘有效信息。不当可视化误导判断值得注意的是,并非所有的可视化都可以指导决策,甚至不当的可视化会误导判断,以致做出错误的决策。 2004年前后,美国有线通信协会(NCTA)发布的报告中,用下图声称美国政府的管制行为导致了企业投资下降,而在放开管制后,企业投资就大量增加。 乍看之下,管制的时候是左柱,投资只有140亿美元,放开管制后,投资有560亿美元貌似结论没有错误。但这张图有严重的误导与逻辑的跳漏。Less regulation = More industry investment$56 billionAfter regulationswere relaxedFollowing 1992 CableRegulations$14 billion1993-19961999-2003 1996-1999年间三年的数据缺失。三年可以发生很多事情,在缺乏数据的情况下,强行将1999年后的投资增长归结于去管制,是有逻辑欠缺的。 左柱只总结了3年的总投资,右柱则总结了4年的总投资,这更是故意误导观众,让观众认为去管制后企业投资大大增加,而游说政府放开行业管制。实际上很可能是其他因素造成的快速增长,而不仅仅是去管制。真相到底是什么?Cable Industry Infrastructure ExpendituresIn billionsS161990 9296 98 oo 02 04 06 08 102013可以看到,事实上96年放开管制后,随后的三年里企业投资并没有显著变化,99年以后的爆发式增长肯定是由于别的原因造成,而非单纯的放开管制。再看一个例子:60,2 60 59.8 -59.6 -59.4 -59.2 -602016595958.858.658.42015这图看起来,是不是16年比15年增加了特别多,实际看看坐标轴,才从59增加到60, 2%不至IJ,把坐标轴换一下:7020152016这样看起来就能体现出2%的增量其实没多少了。不过,根据目的的不同,不排除有的场景也可以采用第一种展现方式。再比如前一段时间好多群都在转的下面这张图,纵坐标从1100万开始,显得2020年的1200万简直快到底了,是不是没人生孩子了» 2000年2020年中国新出生人口数量我们换成从0开始的纵坐标来看看:20002020年中国新出生人口数量这是不是正常多了,虽然也下降得不少,但是整个基数还是很大的。不过,如果需要贩卖焦虑,用上面那张图就比较容易达到效果。2 .什么是数据可视化Concept of data Visualization2.1. 发展历程利用人眼的感知能力对数据进行交互的可视表达以增强认知的技术称为可视化,它将不可见或难以分析的数据转化为可感知的图形、符号、颜色、纹理等等,以提高数据识别和信息传递的效率.<5rawdalo我们拿到的原始数据,可能是半结构化,甚至非结构化的,经过数据清洗和ETL过程,我们得到规整的结构化数据表,再通过视觉映射,我们得到需要展示的视觉结构,即按照什么维度,展示什么指标,最后,将视觉结构通过图像转换,转化为最终的可视化图像,呈现给决策者。我们可以将数据可视化的发展历程分为七个历程。2.1.1. 17世纪之前图表萌芽人类早在公元前6200年就掌握了观测和绘制的能力,此后也一直通过手工的方式制作可视化作品。可视化萌芽出自地图和一些简单的图表,数据也不是测量而来,目的大多是展示一些重要的信息。第11页共45页人类第一幅地图(公元前6200年)公元950年,欧洲人画出了基于时间变化的折线图,用于展示太阳,月亮等行星的位置变化趋势,开始出现如今的数据图表的雏形。2.1.2. 17世纪物理测量17世纪以后,随着对物理基本量(时间、距离等)的测量理论和设备的完善,制图学理论也随着分析几何、概率论等学科迅速发展,17世纪末产生了基于真实测量数据的可视化作品。第12页共45页9士 “匕叱THZHoll a 9 q娱 rvr 5”4人类第一幅天气图(1686年)这幅图是谁画的呢? Edmond Halley(1656-1742),埃德蒙哈雷,是不是挺耳熟,没错,就是发现哈雷彗星的那个哈雷。Edmond Halley图上绘制了信风和季风的方向,“一目了然地显示了这些风的所有不同地段和路线;据此,有可能比任何口头描述都更容易理解”。.2.1.3. 18世纪图形符号进入18世纪,人类不再满足于地图上的几何信息、,随着统计理论、实验数据分析等学科的发展,现在我们所熟悉的函数图、抽象图被广泛发明。Exports and Imports to and from DENMARK & NORWAY from 1700 to 1780.;if>oThe Bottom is di3ded intathe Right hand Itru into L1QOOO each.47“金3«"r"内 夕 "ri3此27必加丹麦和挪威的进出口贸易时间序列此图来自威廉 普莱费尔(WilliamPlayfair, 1759-1823),他是来自苏格兰的工程师和政治经济学家,今天我们使用的折线图、条形图、饼图和面积图都是他发明的。图中

    注意事项

    本文(数据可视化发展简史.docx)为本站会员(lao****ou)主动上传,第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第一文库网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 001doc.com网站版权所有   

    经营许可证编号:宁ICP备2022001085号

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



    收起
    展开