天天看点

Pandas 数据处理基础4---数据删减及其用法

数据删减

虽然我们可以通过数据选择方法从一个完整的数据集中拿到我们需要的数据,但有的时候直接删除不需要的数据更加简单直接。Pandas 中,以 .drop 开头的方法都与数据删减有关。

DataFrame.drop 可以直接去掉数据集中指定的列和行。一般在使用时,我们指定 labels 标签参数,然后再通过 axis 指定按列或按行删除即可。当然,你也可以通过索引参数删除数据,具体查看官方文档。

输出结果(由于实验结果太长了,仅截取一部分):

Pandas 数据处理基础4---数据删减及其用法

DataFrame.drop_duplicates 则通常用于数据去重,即剔除数据集中的重复值。使用方法非常简单,指定去除重复值规则,以及 axis 按列还是按行去除即可。

输出结果(由于实验结果太长了,仅截取一部分):

Pandas 数据处理基础4---数据删减及其用法

除此之外,另一个用于数据删减的方法 DataFrame.dropna 也十分常用,其主要的用途是删除缺少值,即数据集中空缺的数据列或行。

输出结果(由于实验结果太长了,仅截取一部分):

Pandas 数据处理基础4---数据删减及其用法