天天看点

58.时间序列数据转换

作者:李光朱

案例导入

如下表所示,用匿名函数给每个测量值加上一个0-1之间不同的随机数。添加代码注释。

时间 测量值
2022-03-18 00:00:00 5
2022-03-18 01:00:00 9
2022-03-18 02:00:00 6
2022-03-18 03:00:00 9
2022-03-18 04:00:00 8
2022-03-18 05:00:00 10
2022-03-18 06:00:00 4
2022-03-18 07:00:00 3
2022-03-18 08:00:00 6
2022-03-18 09:00:00 3
2022-03-18 10:00:00 1
2022-03-18 11:00:00 6
2022-03-18 12:00:00 7
2022-03-18 13:00:00 4
2022-03-18 14:00:00 1
2022-03-18 15:00:00 7
2022-03-18 16:00:00 4
2022-03-18 17:00:00 10
2022-03-18 18:00:00 8
2022-03-18 19:00:00 6
2022-03-18 20:00:00 6
2022-03-18 21:00:00 1
2022-03-18 22:00:00 5
2022-03-18 23:00:00 4
2022-03-19 00:00:00 5
2022-03-19 01:00:00 5
2022-03-19 02:00:00 4
2022-03-19 03:00:00 1
2022-03-19 04:00:00 8
2022-03-19 05:00:00 6
2022-03-19 06:00:00 1
2022-03-19 07:00:00 2
2022-03-19 08:00:00 8
2022-03-19 09:00:00 4
2022-03-19 10:00:00 9
2022-03-19 11:00:00 1
2022-03-19 12:00:00 8
2022-03-19 13:00:00 2
2022-03-19 14:00:00 5
2022-03-19 15:00:00 2
2022-03-19 16:00:00 6
2022-03-19 17:00:00 9
2022-03-19 18:00:00 6
2022-03-19 19:00:00 2
2022-03-19 20:00:00 1
2022-03-19 21:00:00 8
2022-03-19 22:00:00 1
2022-03-19 23:00:00 2
2022-03-20 00:00:00 6
2022-03-20 01:00:00 6
2022-03-20 02:00:00 10
2022-03-20 03:00:00 9
2022-03-20 04:00:00 6
2022-03-20 05:00:00 7
2022-03-20 06:00:00 8
2022-03-20 07:00:00 10
2022-03-20 08:00:00 1
2022-03-20 09:00:00 3
2022-03-20 10:00:00 1
2022-03-20 11:00:00 3
2022-03-20 12:00:00 2
2022-03-20 13:00:00 10
2022-03-20 14:00:00 9
2022-03-20 15:00:00 5
2022-03-20 16:00:00 2
2022-03-20 17:00:00 4
2022-03-20 18:00:00 10
2022-03-20 19:00:00 7
2022-03-20 20:00:00 6
2022-03-20 21:00:00 10
2022-03-20 22:00:00 4
2022-03-20 23:00:00 7
2022-03-21 00:00:00 7
2022-03-21 01:00:00 9
2022-03-21 02:00:00 8
2022-03-21 03:00:00 6
2022-03-21 04:00:00 2
2022-03-21 05:00:00 6
2022-03-21 06:00:00 10
2022-03-21 07:00:00 3
2022-03-21 08:00:00 2
2022-03-21 09:00:00 1
2022-03-21 10:00:00 7
2022-03-21 11:00:00 2
2022-03-21 12:00:00 9
2022-03-21 13:00:00 1
2022-03-21 14:00:00 7
2022-03-21 15:00:00 2
2022-03-21 16:00:00 2
2022-03-21 17:00:00 10
2022-03-21 18:00:00 5
2022-03-21 19:00:00 5
2022-03-21 20:00:00 4
2022-03-21 21:00:00 6
2022-03-21 22:00:00 4
2022-03-21 23:00:00 1
2022-03-22 00:00:00 5
2022-03-22 01:00:00 10
2022-03-22 02:00:00 6
2022-03-22 03:00:00 9

文心一言提示词

打开百度“文心一言”,输入提示词:“你是pandas专家。文件路径为:D:/Samples/时间序列.xlsx。用pandas导入Excel文件中第1个工作表中的数据,将第1列作为索引列,引擎为”openpyxl”。使用匿名函数给每个测量值加上一个0-1之间不同的随机数。添加代码注释。”

显示结果如下:

首先,确保你已经安装了pandas和openpyxl库,因为openpyxl是用于读取和写入Excel 2010 xlsx/xlsm/xltx/xltm 文件的Python库。如果还没有安装,你可以通过pip安装它们:

pip install pandas openpyxl           

接下来,你可以使用以下Python代码来导入Excel文件中的数据,将第1列作为索引列,并使用匿名函数(lambda)给每个测量值加上一个0-1之间不同的随机数:

import pandas as pd
import numpy as np

# 文件路径
file_path = 'D:/Samples/时间序列.xlsx'

# 读取Excel文件,使用openpyxl作为引擎,并将第1列作为索引列
# 注意:Excel中的第1列通常是A列,但在pandas中索引从0开始,所以这里指的是'A'列
df = pd.read_excel(file_path, sheet_name=0, index_col=0, engine='openpyxl')

# 生成一个与数据框(DataFrame)长度相同的0-1之间的随机数数组
# 注意:这里我们使用numpy的random.rand函数,它生成[0, 1)之间的随机数
random_numbers = np.random.rand(len(df))

# 使用applymap(对于整个DataFrame)或apply(对于Series)是不合适的,
# 因为我们想要对DataFrame中的每个元素进行操作,而不是整个Series或DataFrame。
# 所以我们将直接使用广播功能,即直接将numpy数组与DataFrame相加

# 但是,因为DataFrame可能包含不同类型的列(例如,既有整数又有浮点数),
# 我们需要确保DataFrame中的所有列都是可以与浮点数相加的数值类型。
# 如果不是,我们需要先转换它们。

# 假设所有列都是数值类型,我们可以直接相加
df_with_random = df.add(random_numbers, axis=0)

# 注意:这里我们使用DataFrame的add方法,它将每个随机数与对应行(axis=0)的所有元素相加
# 如果DataFrame中有非数值列,你需要先处理它们(例如,将它们设置为NaN或使用fillna()填充它们)

# 现在df_with_random包含了带有随机数的数据
print(df_with_random)           

注意:上面的代码假设df的所有列都是数值类型的,可以直接与浮点数相加。如果DataFrame中有非数值类型的列(如字符串或日期),你需要先对它们进行处理,因为它们不能与浮点数直接相加。

此外,add方法默认会进行广播操作,即将random_numbers这个一维数组扩展为一个与df形状相同的二维数组(实际上并没有创建新的数组,只是进行了广播操作),然后逐元素相加。这样可以确保每个测量值都加上了一个不同的随机数。

Python运行结果

58.时间序列数据转换

图1.Python运行环境

58.时间序列数据转换

图2.Python运行结果

本合集使用的工具如下:

文心一言:3.5版本

Python编辑器:3.9.0

申明:以上结果皆为实际运行结果,如遇到无法运行可在评论区留言。部分数据来自网络,如有侵权请私信告知,感谢!