Python中文自然语言处理基础与实战(教案)第4章中文分词技术.docx
《Python中文自然语言处理基础与实战(教案)第4章中文分词技术.docx》由会员分享,可在线阅读,更多相关《Python中文自然语言处理基础与实战(教案)第4章中文分词技术.docx(5页珍藏版)》请在第一文库网上搜索。
1、第4章中文分词技术教案课程名称:Python中文自然语言处理基础与实战课程类别:选修适用专业:人工智能类相关专业总学时:64学时(其中理论40学时,实验24学时)总学分:4.0学分本章学时:6学时一、材料清单(1)Python中文自然语言处理基础与实战教材。(2)配套PpT。(3)引导性提问。(4)探究性问题。(5)拓展性问题。二、教学目标与基本要求1教学目标主要介绍了基于规则的分词方法、基于统计的分词方法以及使用jieba进行分词。首先介绍了基于规则的正向最大匹配法、逆向最大匹配法和双向最大匹配法3种中文分词方法的基本原理,并使用Python实现逆向最大匹配法分词。接着对基于统计的n元语法模
2、型和HMM分词方法的原理进行讲解,使用Python实现基于HMM的分词。最后介绍中文分词工具jieba库的分词模式,通过jieba库完成高频词提取。2.基本要求(I)了解中文分词的基本概念。(2)熟悉基于规则分词的基本概念和常用方法。(3)熟悉基于统计分词的基本概念、n元语法模型和隐马尔可夫模型基本原理。(4)掌握中文分词工具jieba库的使用方法。(5)掌握基于隐马尔可夫模型分词和基于jieba分词的实现方法。三、问题1.引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。(1)中文分词是什
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 中文 自然语言 处理 基础 实战 教案 分词 技术
![提示](https://www.001doc.com/images/bang_tan.gif)