我将一些資料加載到 Pandas DataFrame 中,我想将其聚合到日期時間間隔中,并計算每個時間間隔内的記錄數 . 問題是我發現聚合到日期時間間隔并計算每個間隔内的記錄數的方法看起來相當笨重,可能不是最有效的 . 更改我想要分組的間隔以計算推文的數量也是一種痛苦 .
data = [[Timestamp('2016-10-26 18:47:53'), 'mention'],
[Timestamp('2016-10-26 20:28:35'), 'retweet'],
[Timestamp('2016-10-26 20:57:38'), 'tweet'],
[Timestamp('2016-10-26 21:36:37'), 'mention'],
[Timestamp('2016-10-26 22:49:08'), 'tweet'],
[Timestamp('2016-10-27 00:10:19'), 'tweet'],
[Timestamp('2016-10-27 01:14:46'), 'tweet'],
[Timestamp('2016-10-27 01:45:03'), 'retweet'],
[Timestamp('2016-10-27 02:33:03'), 'tweet'],
[Timestamp('2016-10-27 05:55:52'), 'retweet'],
[Timestamp('2016-10-27 14:26:57'), 'mention'],
[Timestamp('2016-10-27 17:46:42'), 'tweet'],
[Timestamp('2016-10-27 17:53:33'), 'retweet'],
[Timestamp('2016-10-27 18:53:38'), 'tweet'],
[Timestamp('2016-10-27 21:02:00'), 'retweet'],
[Timestamp('2016-10-27 21:23:50'), 'retweet'],
[Timestamp('2016-10-27 22:21:01'), 'retweet'],
[Timestamp('2016-10-28 05:30:02'), 'retweet'],
[Timestamp('2016-10-28 13:11:01'), 'retweet'],
[Timestamp('2016-10-28 16:55:13'), 'retweet'],
[Timestamp('2016-10-28 18:25:02'), 'retweet'],
[Timestamp('2016-10-28 18:54:44'), 'retweet'],
[Timestamp('2016-10-28 19:22:14'), 'tweet'],
[Timestamp('2016-10-28 19:23:20'), 'tweet'],
[Timestamp('2016-10-28 22:33:03'), 'tweet']]
df = pd.DataFrame(data, columns=['datetime', 'type'])
df['type'].groupby([df.datetime.dt.month, df.datetime.dt.day,df.datetime.dt.hour]).count().plot(kind="line")
如果您還可以幫助我弄清楚如何将“類型”劃分為3個單獨的行,那麼獎勵積分! :)