天天看點

58.時間序列資料轉換

作者:李光朱

案例導入

如下表所示,用匿名函數給每個測量值加上一個0-1之間不同的随機數。添加代碼注釋。

時間 測量值
2022-03-18 00:00:00 5
2022-03-18 01:00:00 9
2022-03-18 02:00:00 6
2022-03-18 03:00:00 9
2022-03-18 04:00:00 8
2022-03-18 05:00:00 10
2022-03-18 06:00:00 4
2022-03-18 07:00:00 3
2022-03-18 08:00:00 6
2022-03-18 09:00:00 3
2022-03-18 10:00:00 1
2022-03-18 11:00:00 6
2022-03-18 12:00:00 7
2022-03-18 13:00:00 4
2022-03-18 14:00:00 1
2022-03-18 15:00:00 7
2022-03-18 16:00:00 4
2022-03-18 17:00:00 10
2022-03-18 18:00:00 8
2022-03-18 19:00:00 6
2022-03-18 20:00:00 6
2022-03-18 21:00:00 1
2022-03-18 22:00:00 5
2022-03-18 23:00:00 4
2022-03-19 00:00:00 5
2022-03-19 01:00:00 5
2022-03-19 02:00:00 4
2022-03-19 03:00:00 1
2022-03-19 04:00:00 8
2022-03-19 05:00:00 6
2022-03-19 06:00:00 1
2022-03-19 07:00:00 2
2022-03-19 08:00:00 8
2022-03-19 09:00:00 4
2022-03-19 10:00:00 9
2022-03-19 11:00:00 1
2022-03-19 12:00:00 8
2022-03-19 13:00:00 2
2022-03-19 14:00:00 5
2022-03-19 15:00:00 2
2022-03-19 16:00:00 6
2022-03-19 17:00:00 9
2022-03-19 18:00:00 6
2022-03-19 19:00:00 2
2022-03-19 20:00:00 1
2022-03-19 21:00:00 8
2022-03-19 22:00:00 1
2022-03-19 23:00:00 2
2022-03-20 00:00:00 6
2022-03-20 01:00:00 6
2022-03-20 02:00:00 10
2022-03-20 03:00:00 9
2022-03-20 04:00:00 6
2022-03-20 05:00:00 7
2022-03-20 06:00:00 8
2022-03-20 07:00:00 10
2022-03-20 08:00:00 1
2022-03-20 09:00:00 3
2022-03-20 10:00:00 1
2022-03-20 11:00:00 3
2022-03-20 12:00:00 2
2022-03-20 13:00:00 10
2022-03-20 14:00:00 9
2022-03-20 15:00:00 5
2022-03-20 16:00:00 2
2022-03-20 17:00:00 4
2022-03-20 18:00:00 10
2022-03-20 19:00:00 7
2022-03-20 20:00:00 6
2022-03-20 21:00:00 10
2022-03-20 22:00:00 4
2022-03-20 23:00:00 7
2022-03-21 00:00:00 7
2022-03-21 01:00:00 9
2022-03-21 02:00:00 8
2022-03-21 03:00:00 6
2022-03-21 04:00:00 2
2022-03-21 05:00:00 6
2022-03-21 06:00:00 10
2022-03-21 07:00:00 3
2022-03-21 08:00:00 2
2022-03-21 09:00:00 1
2022-03-21 10:00:00 7
2022-03-21 11:00:00 2
2022-03-21 12:00:00 9
2022-03-21 13:00:00 1
2022-03-21 14:00:00 7
2022-03-21 15:00:00 2
2022-03-21 16:00:00 2
2022-03-21 17:00:00 10
2022-03-21 18:00:00 5
2022-03-21 19:00:00 5
2022-03-21 20:00:00 4
2022-03-21 21:00:00 6
2022-03-21 22:00:00 4
2022-03-21 23:00:00 1
2022-03-22 00:00:00 5
2022-03-22 01:00:00 10
2022-03-22 02:00:00 6
2022-03-22 03:00:00 9

文心一言提示詞

打開百度“文心一言”,輸入提示詞:“你是pandas專家。檔案路徑為:D:/Samples/時間序列.xlsx。用pandas導入Excel檔案中第1個工作表中的資料,将第1列作為索引列,引擎為”openpyxl”。使用匿名函數給每個測量值加上一個0-1之間不同的随機數。添加代碼注釋。”

顯示結果如下:

首先,確定你已經安裝了pandas和openpyxl庫,因為openpyxl是用于讀取和寫入Excel 2010 xlsx/xlsm/xltx/xltm 檔案的Python庫。如果還沒有安裝,你可以通過pip安裝它們:

pip install pandas openpyxl           

接下來,你可以使用以下Python代碼來導入Excel檔案中的資料,将第1列作為索引列,并使用匿名函數(lambda)給每個測量值加上一個0-1之間不同的随機數:

import pandas as pd
import numpy as np

# 檔案路徑
file_path = 'D:/Samples/時間序列.xlsx'

# 讀取Excel檔案,使用openpyxl作為引擎,并将第1列作為索引列
# 注意:Excel中的第1列通常是A列,但在pandas中索引從0開始,是以這裡指的是'A'列
df = pd.read_excel(file_path, sheet_name=0, index_col=0, engine='openpyxl')

# 生成一個與資料框(DataFrame)長度相同的0-1之間的随機數數組
# 注意:這裡我們使用numpy的random.rand函數,它生成[0, 1)之間的随機數
random_numbers = np.random.rand(len(df))

# 使用applymap(對于整個DataFrame)或apply(對于Series)是不合适的,
# 因為我們想要對DataFrame中的每個元素進行操作,而不是整個Series或DataFrame。
# 是以我們将直接使用廣播功能,即直接将numpy數組與DataFrame相加

# 但是,因為DataFrame可能包含不同類型的列(例如,既有整數又有浮點數),
# 我們需要確定DataFrame中的所有列都是可以與浮點數相加的數值類型。
# 如果不是,我們需要先轉換它們。

# 假設所有列都是數值類型,我們可以直接相加
df_with_random = df.add(random_numbers, axis=0)

# 注意:這裡我們使用DataFrame的add方法,它将每個随機數與對應行(axis=0)的所有元素相加
# 如果DataFrame中有非數值列,你需要先處理它們(例如,将它們設定為NaN或使用fillna()填充它們)

# 現在df_with_random包含了帶有随機數的資料
print(df_with_random)           

注意:上面的代碼假設df的所有列都是數值類型的,可以直接與浮點數相加。如果DataFrame中有非數值類型的列(如字元串或日期),你需要先對它們進行處理,因為它們不能與浮點數直接相加。

此外,add方法預設會進行廣播操作,即将random_numbers這個一維數組擴充為一個與df形狀相同的二維數組(實際上并沒有建立新的數組,隻是進行了廣播操作),然後逐元素相加。這樣可以確定每個測量值都加上了一個不同的随機數。

Python運作結果

58.時間序列資料轉換

圖1.Python運作環境

58.時間序列資料轉換

圖2.Python運作結果

本合集使用的工具如下:

文心一言:3.5版本

Python編輯器:3.9.0

申明:以上結果皆為實際運作結果,如遇到無法運作可在評論區留言。部分資料來自網絡,如有侵權請私信告知,感謝!