基于Python的招聘网站爬虫及可视化的设计与实现.docx
《基于Python的招聘网站爬虫及可视化的设计与实现.docx》由会员分享,可在线阅读,更多相关《基于Python的招聘网站爬虫及可视化的设计与实现.docx(33页珍藏版)》请在第一文库网上搜索。
1、1IAbstractII1.1 引言11.2 课题内容21.3 课题背景21.4 课题意义31.5 运行环境31.6 相关技术31.6.1 Python语言31.6.2 F1aSk框架41.6.3 ECharts图表库41.6.4 Jieba库51.6.5 PySqI包51.7 本章小结5第2章系统设计62.1 设计思想62.2 需求分析62.3 系统可行性分析72.4 功能设计72.4.1 系统功能结构72.4.2 系统功能模块设计82.4.3 系统流程图92.5 数据库设计93.1 岗位信息爬取模块设计113.2 数据库的连接及使用133.2.1 连接数据库133.2.2 数据概览数据库查
2、询133.2.3 学历情况数据库查询143.2.4 企业情况数据库查询153.2.5 薪资情况数据库查询163.3 数据可视化设计163.3.1 福利词云设计163.3.2 柱状图和折线图183.3.3 矩形树图193.3.4 饼图203.4 可视化展示203.4.1 数据概况20342薪资情况203.4.3 企业情况223.4.4 福利情况223.4.5 学历情况233.5 本章小结23第4章功能测试244.1 测试内容244.2 测试结果254.3 本章小结25结论26致谢27参考文献27基于Python的招聘网站爬虫及可视化的设计与实现摘要:现在,随着互联网网络的飞速发展,人们获取信息的
3、最重要来源也由报纸、电视转变为了互联网。互联网的广泛应用使网络的数据量呈指数增长,让人们得到了更新、更完整的海量信息的同时,也使得人们在提取自己最想要的信息,过滤掉对自己无用的信息时变得不那么容易,对于应聘者也是如此。由于招聘网站的日益流行,也使得应聘网站成为了应聘者找工作的主要平台。在面对着大量的招聘信息时,就业者不能一目了然的获取自己想要的招聘信息,因此我们需要对海量的招聘数据进行处理,做出一种招聘信息的分析系统。在此基础上本文介绍了基于PythOn的招聘网站的爬虫及可视化的设计与分析过程中的技术线路。本招聘网站的爬虫及可视化使用Python语言编写,使用基于F1ask的轻量级Web应用框
4、架,数据库使用MySQ1,使用EChartS进行数据可视化部分的显示。对数据的爬取使用的Requests进行爬取数据,本次爬取的招聘网站为拉勾网搜索关键词为Java、PythonPhp的招聘信息,拉勾网具有较强的反爬虫机制,采用COOkie形式进行封装,再进行数据的获取。在MySQ1数据库中存储爬取的招聘信息,用Pymysq1包连接MySQ1数据库将查询的数据使用EChartS框架展示到网页。通过本系统可以用户可以了解到职位的信息概况、薪资分布情况、企业主要招聘城市情况和企业的规模分布、职位的福利待遇和对应聘者的学历要求,工作经验的要求。关键词:PythOn爬虫;数据可视化;招聘网站Desig
5、nandImp1ementationofRecruitmentWebsiteCraw1erandVisua1izationBasedonPythonAbstract:Withtherapiddeve1opmentoftheInternet,themostimportantsourceforpeop1etoobtaininformationhaschangedfromnewspaperandTVtotheinternet.Thewideapp1icationoftheInternetmakestheamountofdataonthenetworkgrowexponentia11y.Whi1epe
6、op1egeta1otofnewandmorecomp1eteinformation,ita1somakesitdifficu1tforpeop1etoextracttheinformationtheywantmostandfi1terouttheinformationthatisuse1esstothem.Thisisa1sothecaseforjobapp1icants.Withtheincreasingpopu1arityofrecruitmentwebsites,recruitmentwebsiteshavebecomethemainp1atformforjobseekerstofin
7、djobs.Facedwitha1argenumberofrecruitmentinformation,theemp1oyeescannotgettherecruitmentinformationtheywantatag1ance,soweneedtoprocessthemassiverecruitmentdata,tomakearecruitmentinformationana1ysissystem.Onthisbasis,thispaperintroducesthetechnica11inesinthedesignandana1ysisofthecraw1erandvisua1izatio
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Python 招聘 网站 爬虫 可视化 设计 实现