盘点66个Pandas函数.docx
《盘点66个Pandas函数.docx》由会员分享,可在线阅读,更多相关《盘点66个Pandas函数.docx(16页珍藏版)》请在第一文库网上搜索。
1、盘点66个Pandas函数,轻松搞定“数据清洗”!今天我们来盘点66个Pandas函数合集,包括数据预览、数值数据操作、文本数据操作、行/列操作等等,涉及“数据清洗”的方方面面。Pandas是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。它提供了大量能使我们快速便捷地处理数据的函数和方法。数据预览对于探索性数据分析来说,做数据分析前需要先看一下数据的总体概况。infoO方法用来查看数据集信息,describeO方法将返回描述性统计信息,这两个函数大家应该都很熟悉了。describe方法默认只给出数值型变量的常用统计量,要想对DataFrame中的每个变量进行汇总统计,可以将其中
2、的参数include 设为 al 1 ohead。方法和tailO 方法则是分别显示数据集的前n和后n行数据。如果想要随机看N行的数据,可以使用sample。方法。df sample(3)输出:日期销量1 2022-03-02 1004 2022-03-05 1222 2022-03-0395如果要检查数据中各列的数据类型,可以使用.dtypes;如果想要值查看所有的列名,可以使用. columnsodf 1李四225SA66387姓名迟到天数01231唯一值,unique。是以数组形式返回列的所有唯一值,而nuni que ()返回的是唯一值的个数。输出:df“gender, unique(
3、)array (female, male, dtype=ob ject)df gender*. nunique()2在数值数据操作中,apply ()函数的功能是将一个自定义函数作用于Dat a Frame的行或者列;applymap ()函数的功能是将自定义函数作用于DataFrame的所有元素。他们通常也与匿名函数lambda 一起使用。df 数量. apply ( Lambda x: x+1)输出:姓名数量姓名数量0虹11李四2230 5SH 21李四 3文本数据操作在对文本型的数据进行处理时,我们会大量应用字符串的函数,来实现对一列文本数据进行操作。函数方法catcontainssta
4、rtswith/endswith用法释义字符串的拼接判断某个字符串是否包(判断某个字符串是否以.getIon获取指定位置的字计算字符串长月upper、 lower英文大小写转书pad/ccnter在字符串的左边、右边或左右方repeatslice_replacesplitstrip、 rslrip、 1strip重复字符串几z使用给定的字符串,替换指灯分割字符串,将一列扩去除空白符、换彳:用法释义函数方法findall利用正则表达式,去字符串中匹配,extract、 extract接受正则表达式,抽取匹配的字符all举例:df. insert (2,姓名,df 姓Lstr.cat(df 名se
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 盘点 66 Pandas 函数