【Python】pandas实战指南：快速删除行数据的技巧

CrazyPanda发表于：2024-01-10 23:28:02浏览：300次TAG：

pandas实战指南：快速删除行数据的技巧

概述：
Pandas是Python中一个常用的数据分析库，具有强大的数据处理和操作功能。在数据处理过程中，经常需要删除不需要的行数据，本文将介绍一些使用pandas删除行数据的技巧，并提供具体的代码示例。

一、删除特定条件的行数据

删除某个特定值的行：
在pandas中，可以使用DataFrame的drop方法来删除特定值的行。首先，我们需要创建一个示例数据集：

import pandas as pd
 
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
 
df = pd.DataFrame(data)

现在我们要删除Gender为Male的行，可以使用以下代码：

df = df.drop(df[df['Gender'] == 'Male'].index)

运行后，df中会删除Gender为Male的行数据。
代码解析：

df['Gender'] == 'Male' 是一个条件判断语句，返回一个布尔类型的Series对象，表示Gender列中值为Male的行；
df[df['Gender'] == 'Male'].index 返回索引，即Gender为'Male'的行所在的索引位置；
df.drop() 方法可以根据索引删除行。

删除空值行：
有时候需要删除包含空值的行数据，例如：

import pandas as pd
import numpy as np
 
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, np.nan, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

我们可以使用dropna()方法删除包含空值的行：

df = df.dropna()

运行后，df将删除包含空值的行数据。

删除重复行：
若数据集中包含重复的行，我们可以使用drop_duplicates()方法删除重复行数据：

import pandas as pd
 
data = {'Name': ['Alice', 'Bob', 'Bob', 'David'],
        'Age': [25, 30, 30, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

现在我们可以使用以下代码删除重复行：

df = df.drop_duplicates()

二、根据行索引删除行

有时我们需要根据行索引进行删除，可以使用drop()方法根据索引删除行数据。

import pandas as pd
 
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
 
df = pd.DataFrame(data)

假设我们要删除索引为2的行，可以使用以下代码：

df = df.drop(2)

运行后，索引为2的行被删除。

三、删除多个行
有时候需要删除多个行，可以通过传入一个索引的list或使用切片的方式实现。

import pandas as pd
 
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
 
df = pd.DataFrame(data)

示例1：删除索引为1和2的行