天天看点

57.时间序列数据筛选

作者:李光朱

案例导入

如下数据表,筛选出测量值大于等于9的数据。添加代码注释。

时间 测量值
2022-03-18 00:00:00 5
2022-03-18 01:00:00 9
2022-03-18 02:00:00 6
2022-03-18 03:00:00 9
2022-03-18 04:00:00 8
2022-03-18 05:00:00 10
2022-03-18 06:00:00 4
2022-03-18 07:00:00 3
2022-03-18 08:00:00 6
2022-03-18 09:00:00 3
2022-03-18 10:00:00 1
2022-03-18 11:00:00 6
2022-03-18 12:00:00 7
2022-03-18 13:00:00 4
2022-03-18 14:00:00 1
2022-03-18 15:00:00 7
2022-03-18 16:00:00 4
2022-03-18 17:00:00 10
2022-03-18 18:00:00 8
2022-03-18 19:00:00 6
2022-03-18 20:00:00 6
2022-03-18 21:00:00 1
2022-03-18 22:00:00 5
2022-03-18 23:00:00 4
2022-03-19 00:00:00 5
2022-03-19 01:00:00 5
2022-03-19 02:00:00 4
2022-03-19 03:00:00 1
2022-03-19 04:00:00 8
2022-03-19 05:00:00 6
2022-03-19 06:00:00 1
2022-03-19 07:00:00 2
2022-03-19 08:00:00 8
2022-03-19 09:00:00 4
2022-03-19 10:00:00 9
2022-03-19 11:00:00 1
2022-03-19 12:00:00 8
2022-03-19 13:00:00 2
2022-03-19 14:00:00 5
2022-03-19 15:00:00 2
2022-03-19 16:00:00 6
2022-03-19 17:00:00 9
2022-03-19 18:00:00 6
2022-03-19 19:00:00 2
2022-03-19 20:00:00 1
2022-03-19 21:00:00 8
2022-03-19 22:00:00 1
2022-03-19 23:00:00 2
2022-03-20 00:00:00 6
2022-03-20 01:00:00 6
2022-03-20 02:00:00 10
2022-03-20 03:00:00 9
2022-03-20 04:00:00 6
2022-03-20 05:00:00 7
2022-03-20 06:00:00 8
2022-03-20 07:00:00 10
2022-03-20 08:00:00 1
2022-03-20 09:00:00 3
2022-03-20 10:00:00 1
2022-03-20 11:00:00 3
2022-03-20 12:00:00 2
2022-03-20 13:00:00 10
2022-03-20 14:00:00 9
2022-03-20 15:00:00 5
2022-03-20 16:00:00 2
2022-03-20 17:00:00 4
2022-03-20 18:00:00 10
2022-03-20 19:00:00 7
2022-03-20 20:00:00 6
2022-03-20 21:00:00 10
2022-03-20 22:00:00 4
2022-03-20 23:00:00 7
2022-03-21 00:00:00 7
2022-03-21 01:00:00 9
2022-03-21 02:00:00 8
2022-03-21 03:00:00 6
2022-03-21 04:00:00 2
2022-03-21 05:00:00 6
2022-03-21 06:00:00 10
2022-03-21 07:00:00 3
2022-03-21 08:00:00 2
2022-03-21 09:00:00 1
2022-03-21 10:00:00 7
2022-03-21 11:00:00 2
2022-03-21 12:00:00 9
2022-03-21 13:00:00 1
2022-03-21 14:00:00 7
2022-03-21 15:00:00 2
2022-03-21 16:00:00 2
2022-03-21 17:00:00 10
2022-03-21 18:00:00 5
2022-03-21 19:00:00 5
2022-03-21 20:00:00 4
2022-03-21 21:00:00 6
2022-03-21 22:00:00 4
2022-03-21 23:00:00 1
2022-03-22 00:00:00 5
2022-03-22 01:00:00 10
2022-03-22 02:00:00 6
2022-03-22 03:00:00 9

文心一言提示词

打开百度“文心一言”,输入提示词:“你是pandas专家。文件路径为:D:/Samples/时间序列.xlsx。用pandas导入Excel文件中第1个工作表中的数据,将第1列作为索引列,引擎为”openpyxl”。试筛选出测量值大于等于9的数据。添加代码注释。”

显示结果如下:

首先,确保你已经安装了pandas和openpyxl库。如果没有安装,你可以使用pip进行安装:

pip install pandas openpyxl           

然后,你可以使用以下代码来导入Excel文件中的数据,将第1列作为索引列,并筛选出测量值大于等于9的数据。

import pandas as pd

# 文件路径
file_path = 'D:/Samples/时间序列.xlsx'

# 使用pandas读取Excel文件,指定工作表索引为0(即第1个工作表),将第1列设置为索引列,引擎为'openpyxl'
# 注意:索引在Python中是从0开始的,所以第1个工作表是索引0
df = pd.read_excel(file_path, sheet_name=0, index_col=0, engine='openpyxl')

# 筛选出测量值(假设列名为'测量值')大于等于9的数据
# 如果你的列名不是'测量值',请替换为实际的列名
filtered_df = df[df['测量值'] >= 9]

# 打印筛选后的数据
print(filtered_df)

# 如果需要将筛选后的数据保存到新的Excel文件,可以使用以下代码
output_file_path = 'D:/Samples/筛选后的时间序列.xlsx'
filtered_df.to_excel(output_file_path, index=True, engine='openpyxl')           

代码注释版:

import pandas as pd

# 定义Excel文件的路径
file_path = 'D:/Samples/时间序列.xlsx'

# 使用pandas的read_excel函数读取Excel文件
# sheet_name=0表示读取第1个工作表(因为索引从0开始)
# index_col=0表示将第1列设置为索引列
# engine='openpyxl'指定使用openpyxl引擎读取Excel文件
# 注释中的'测量值'是假设的列名,你需要替换为实际的列名
# 读取数据到DataFrame对象df中
df = pd.read_excel(file_path, sheet_name=0, index_col=0, engine='openpyxl')

# 使用布尔索引筛选数据,假设列名为'测量值'
# 筛选出'测量值'列中大于等于9的数据
filtered_df = df[df['测量值'] >= 9]

# 打印筛选后的数据
print("筛选后的数据:")
print(filtered_df)

# 如果需要将筛选后的数据保存到新的Excel文件
# 定义输出文件的路径
output_file_path = 'D:/Samples/筛选后的时间序列.xlsx'

# 使用to_excel方法将筛选后的数据保存到新的Excel文件中
# index=True表示将索引也保存到文件中
filtered_df.to_excel(output_file_path, index=True, engine='openpyxl')
print(f"筛选后的数据已保存到 {output_file_path}")           

请确保替换'测量值'为你的实际列名。如果列名包含空格、特殊字符或不是英文,确保在引用时使用正确的引号(通常是单引号或双引号)。

Python运行结果

57.时间序列数据筛选

图1.Python运行代码

57.时间序列数据筛选

图2.Python运行结果

本合集使用的工具如下:

文心一言:3.5版本

Python编辑器:3.9.0

申明:以上结果皆为实际运行结果,如遇到无法运行可在评论区留言。部分数据来自网络,如有侵权请私信告知,感谢!