Python网络爬虫技术与实践 教学大纲.docx
《Python网络爬虫技术与实践 教学大纲.docx》由会员分享,可在线阅读,更多相关《Python网络爬虫技术与实践 教学大纲.docx(3页珍藏版)》请在第一文库网上搜索。
1、PythOi1网络爬虫课程教学大纲课程代码:课程名称:Python网络爬虫/WebCraw1erProgrammingwithPython开课学期:学分/学时:3/32+16课程类型:必修/选修适用专业/开课对象:先修课程:开课单位:团队负责人:责任教授:执笔人:核准院长:一、课程的性质、目的与任务Python网络爬虫是计算机科学、软件工程等专业中的一项面向实践的课程,与高级程序设计语言、计算机网络等课程相关。本课程的目标在于使学生循序渐进地了解并掌握网络爬虫编写,在学习Python编程的基本方法与常见技巧的同时,对网络与Web相关知识也取得较好的理解。本课程的安排为:介绍Python编程基础
2、知识,之后引入数据采集与预处理等网络抓取基本概念,然后详细介绍使用Python处理各类问题的方法,包括网页解析、文件存储、数据库存储、文本分析等方面。之后进入主体部分即各类爬虫程序的编写,包括静态网页抓取、动态网页抓取、处理AJAX页面等。最后以几个较为综合的实践课题来让学生应用所学内容,完成有一定应用价值的爬虫程序。本课程不仅要求学生掌握知识与理论,还要求学生动手实践,鼓励学生自主探索,培养对于技术以及应用场景的理解。二、教学内容及教学基本要求1Python语言及编程基础(4学时)了解Python语言的基本知识,学会Python的安装与开发环境配置,包括WindOWS与UbUntU等不同系统
3、平台上的安装与配置;了解PyCharm与JUPyterNOteboOk等重要开发工具的使用;掌握Python的基本语法,理解Python中的数据类型、逻辑语句、函数与类(面向对象编程);学会进阶学习Python的方法;2 .数据采集与预处理(4学时)了解数据,包括数据和大数据的基础概念、类型、组织形式等:以及数据分析的基本环节。掌握数据源与采集方法;掌握预处理任务包括数据清洗、数据集成、数据转换和数据脱敏四部分。3 .静态网页采集(4学时)了解包括正则表达式、Beautifu1Soup.XPath等在内的网页解析工具;掌握遍历网站页面与使用网站所提供的AP1来获取数据的方法。4 .文件与数据存
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python网络爬虫技术与实践 教学大纲 Python 网络 爬虫 技术 实践