欢迎来到第一文库网! | 帮助中心 第一文库网-每个人都是第一
第一文库网
全部分类
  • 研究报告>
  • 学术论文>
  • 全科教育>
  • 应用文档>
  • 行业资料>
  • 企业管理>
  • 技术资料>
  • 生活休闲>
  • ImageVerifierCode 换一换
    首页 第一文库网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    Python网络爬虫技术与实践 教学大纲.docx

    • 资源ID:1120628       资源大小:17.85KB        全文页数:3页
    • 资源格式: DOCX        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录 微博登录
    二维码
    扫码关注公众号登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    Python网络爬虫技术与实践 教学大纲.docx

    PythOi1网络爬虫课程教学大纲课程代码:课程名称:Python网络爬虫/WebCraw1erProgrammingwithPython开课学期:学分/学时:3/32+16课程类型:必修/选修适用专业/开课对象:先修课程:开课单位:团队负责人:责任教授:执笔人:核准院长:一、课程的性质、目的与任务Python网络爬虫是计算机科学、软件工程等专业中的一项面向实践的课程,与高级程序设计语言、计算机网络等课程相关。本课程的目标在于使学生循序渐进地了解并掌握网络爬虫编写,在学习Python编程的基本方法与常见技巧的同时,对网络与Web相关知识也取得较好的理解。本课程的安排为:介绍Python编程基础知识,之后引入数据采集与预处理等网络抓取基本概念,然后详细介绍使用Python处理各类问题的方法,包括网页解析、文件存储、数据库存储、文本分析等方面。之后进入主体部分即各类爬虫程序的编写,包括静态网页抓取、动态网页抓取、处理AJAX页面等。最后以几个较为综合的实践课题来让学生应用所学内容,完成有一定应用价值的爬虫程序。本课程不仅要求学生掌握知识与理论,还要求学生动手实践,鼓励学生自主探索,培养对于技术以及应用场景的理解。二、教学内容及教学基本要求1Python语言及编程基础(4学时)了解Python语言的基本知识,学会Python的安装与开发环境配置,包括WindOWS与UbUntU等不同系统平台上的安装与配置;了解PyCharm与JUPyterNOteboOk等重要开发工具的使用;掌握Python的基本语法,理解Python中的数据类型、逻辑语句、函数与类(面向对象编程);学会进阶学习Python的方法;2 .数据采集与预处理(4学时)了解数据,包括数据和大数据的基础概念、类型、组织形式等:以及数据分析的基本环节。掌握数据源与采集方法;掌握预处理任务包括数据清洗、数据集成、数据转换和数据脱敏四部分。3 .静态网页采集(4学时)了解包括正则表达式、Beautifu1Soup.XPath等在内的网页解析工具;掌握遍历网站页面与使用网站所提供的AP1来获取数据的方法。4 .文件与数据存储(4学时)掌握使用PythOn进行文件读写的方法;掌握PythOn中字符串的处理;了解Python中对图片的各类操作;掌握CSV文件的读写;掌握MySQ1、SQ1ite3等不同数据库的使用。5 .JavaScript与动态网页(4学时)了解JaVaSCriPt语言的基本知识;掌握AJAX技术的基本概念;掌握抓取AJAX数据的各类方法;了解SeIeniUm等浏览器自动化工具的使用。6 .模拟登录与验证码(2学时)讲解处理表单的方法;讲述使用COokie等方法进行模拟登录。7 .爬虫数据的分析与处理(2学时)讲述使用Python进行文本分析、数据处理等各类高级问题的方法。8 .爬虫的灵活性和多样性(4学时)讲述常见的爬虫框架使用:讲解各类多样化爬虫程序。9 .SE1ENIUM模拟浏览器与网站测试(2学时)了解常见测试方式以及PythOn的单元测试,熟悉Se1eniUm框架,掌握利用Se1eniUm进行测试的方法。10 .爬虫框架SCRAPY与反爬虫(2学时)讲述常见的网站反爬虫策略;了解应对反爬虫的方法;编写高性能的爬虫程序。三、教学方法本课程以教师讲授为主,同时注重学生讨论和实验。实验以个人作业、团队作业等形式体现。具体要点包括:1 .因本课程实践性较强,因此应注意教师授课与学生实验并重。本课程拟采取PPT的教学方式,并加入课程知识相关的信息,由于网络爬虫技术本身发展速度很快,且贴近日常网络生活,因此在材料选择上尤其注意时效性。2 .对于课程中涉及的程序案例,鼓励学生进行讨论,并提出自己的创意。3 .为体现面向实践的课程特点,本课程在每部分结束后安排实验作业,帮助学生将所学知识动手应用。四、课内外教学环节及基本要求本课程共32+16个学时,理论32个学时,讲授16周(每周2学时);实验16个学时。课外学习要求:1 .做好预习,学生预习时以教材与推荐阅读材料为主。2 .要求学生课外积极探索课程相关知识,向学生推荐的阅读参考资料以本大纲所列出参考资料为主。3 .强调实验内容的重要性,并对学生每次完成的实验作业进行反馈(包括打分、意见、学生互评等)。五、考核内容及方式本课程成绩由平时成绩、实验成绩和期末考核成绩组合而成,课程成绩以百分制计算,分配比例如下:1 .平时成绩占20%,主要考察理论课与实验课出勤率,其中理论作业占10%,理论课出勤率占比5%,实验课出勤率占比5%。2 .实验成绩占50%,主要考察实践项目的完成度。最终实验成绩取所有实验成绩的平均数。3 .期末成绩占30%,采用考试的考核方式。考试采用闭卷形式,题型为选择题、正确/错误题、填空题、简答题和应用题。六、持续改进本课程根据学生作业、课堂讨论、平时考核情况和学生、教学督导等反馈,及时对教学中不足之处进行改进,并在下一轮课程教学中有所提高。七、建议教材及参考资料建议教材:1吕云翔等.Python网络爬虫技术与实践M.北京:机械工业出版社,2023

    注意事项

    本文(Python网络爬虫技术与实践 教学大纲.docx)为本站会员(lao****ou)主动上传,第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第一文库网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 001doc.com网站版权所有   

    经营许可证编号:宁ICP备2022001085号

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



    收起
    展开