基于豆瓣网电影数据的分析与可视化.docx
《基于豆瓣网电影数据的分析与可视化.docx》由会员分享,可在线阅读,更多相关《基于豆瓣网电影数据的分析与可视化.docx(39页珍藏版)》请在第一文库网上搜索。
1、基于豆瓣网电影数据的分析与可视化摘要随着我国互联网行业和数字电影行业的不断飞速发展,两者之间的合作联系越来越紧密。还陆续出现了许多基于互联网上的视频播放网站。用户想要在这些视频播放网站上找到自己喜欢的电影是一件很不容易的事,为了给用户的选择提供一个有用的参考,在庞大的网络电影库中快速找到自己真正喜欢的网络电影,本次课题从电影信息和短评信息两方面入手设计了豆瓣电影数据可视化系统。为了更好地对国内电影网站数据进行分析,本课题首先利用Python+Scrapy建立一套爬虫系统,收集豆瓣网的相关数据,通过MySq1数据库把获取到的电影名、电影导演、电影评分、电影类型、评论用户等数据进行持久化,为整个可
2、视化系统提供了广泛而可靠的数据支持。最后使用PythOn提供的第三方库MatPIOtIib、Pands和EXCeI数据可视化工具进行数据清洗和以图形的形式直观地展示数据结果,并多角度分析电影的发展,得出相关结论。关键词:Scrapy;Python;第三方库;数据可视化;电影AbstractWiththerapiddeve1opmentofChina,sInternetindustryanddigita1fi1mindustry,thecooperationbetweenthetwoismoreandmorec1ose.Therearea1somanyInternet-basedvideop1a
3、ybackwebsites.Userswanttofindtheirfavoritemovieonthesevideop1aybacksiteisaverynoteasything,inordertogivetheuserchoicetoprovideausefu1reference,inthehugenetworkmovie1ibraryquick1yfindtheirrea11y1ikenetworkmovie,thesubjectfromthemovieinformationandshortreviewinformationdesignthedoubanmoviedatavisua1iz
4、ationsystem.Inordertobetterana1yzethedomesticfi1mwebsitedata,thistopicfirstusePython+Scrapytoestab1ishacraw1ersystem,co11ectre1evantdataofdouban,throughMysq1databasetoobtainthemoviename,moviedirector,movierating,movietype,anduserdataforpersistent,providesextensiveandre1iab1edatasupportforthewho1evis
5、ua1izationsystem.Fina11y,thethird-party1ibraryMatp1ot1ib,PandsandExce1datavisua1izationtoo1sprovidedbyPythonwereusedtoc1eanthedataandintuitive1ydisp1aythedataresu1tsingraphica1form,andthedeve1opmentofthefi1mwasana1yzedfrommu1tip1eang1estodrawre1evantconc1usions.Keywords:Scrapy;Python;third-party1ibr
6、ary;datavisua1ization;movie1绪论11.1 研究背景和意义11.2 国内外研究现状21.3 系统主要内容及论文结构安排31.3.1 系统主要内容31.3.2 论文结构安排42相关技术与开发环境52.1 相关技术简介52.1.1 Python简介52.1.2 XPath简介52.1.3 SCraPy框架简介52.1.4 Matp1ot1ib简介62.1.5 Pandas简介62.2 开发环境72.2.1 PyCharm简介72.2.2 MySqI简介72.3 本章小结72.4 性与需求分析83.1 可行性分析83.1.1 技术可行性83.1.2 经济可行性83.1.3
7、操作可行性83.2 需求分析93.2.1 系统功能需求分析93.2.2 各功能用例分析93.2.3 可视化功能性分析113.2.4 可视化非功能性分析123.3 本章小结124数据可视化总体设计134.1 数据可视化架构设计134.2 系统功能模块设计134.2.1 数据采集功能模块设计144.2.2 数据可视化功能模块设计164.3 时序图设计174.4 系统数据库设计184.4.1 数据库概念结构设计184.4.2 数据库逻辑结构设计184.5 本章小结195数据可视化系统实现215.1 数据采集功能实现215.2 数据可视化功能实现235.3 本章小结246数据可视化结果展示256.1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 豆瓣 电影 数据 分析 可视化
