Python中文自然语言处理基础与实战(教案)第7章文本向量化.docx
《Python中文自然语言处理基础与实战(教案)第7章文本向量化.docx》由会员分享,可在线阅读,更多相关《Python中文自然语言处理基础与实战(教案)第7章文本向量化.docx(4页珍藏版)》请在第一文库网上搜索。
1、第7章文本向量化教案课程名称:Python中文自然语言处理基础与实战课程类别:选修适用专业:人工智能类相关专业总学时:64学时(其中理论40学时,实验24学时)总学分:4.0学分本章学时:6学时一、材料清单(1)Python中文自然语言处理基础与实战教材。(2)配套PpT。(3)引导性提问。(4)探究性问题。(5)拓展性问题。二、教学目标与基本要求1教学目标主要介绍文本向量化的基本概念和两种表示方法。首先介绍词向量和文本向量化的基本概念。接着分别介绍文本的离散表示和分布式表示方法,其中离散表示介绍了one-hot.BOW模型和TF-IDF3种表示方法,分布式表示介绍Word2Vec模型和Doc
2、2Vec模型各自的两个模型。最后结合代码详细介绍利用gensim进行向量化的模型训练和应用。2.基本要求(1) 了解文本向量化的基本概念。(2) 了解文本离散表示的常用方法。(3)熟悉文本向量化模型Word2Vec和Doc2Vec的基本原理。(4)掌握Word2Vec和Doc2Vec模型训练的流程和文本相似度的计算方法。三、问题1 .引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。(I)文本向量化是什么?(2)文本向量化有哪些形式?2 .探究性问题探究性问题需要教师深入钻研教材的基础上精心
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 中文 自然语言 处理 基础 实战 教案 文本 量化