PyG架構：mini-batch

2023-07-02 17:28:00

一、mini-batch

在graph classification的一些基準資料集中，每個圖的樣本都很小，如果每次隻操作一個，不能充分利用GPU資源。是以考慮把它們分成多個mini-batch。

1、原理

mini-batch就是并行處理多個圖，這裡把多個圖的鄰接矩陣A1、A2、……拼接成一個大的矩陣，可以看作一個對角矩陣（出現了很多0元素，即稀疏矩陣的存儲）

PyG架構：mini-batch

在imgae、language領域中的mini-batch有兩種方法：rescaling、padding，把每個樣本都處理成一樣的size、一樣的shape。

但是這兩種方法都不适用于graph，會造成很多不必要的記憶體浪費。

2、代碼

PyG架構中的dataloader事先封裝好了

from torch_geometric.loader import DataLoader

train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

for step, data in enumerate(train_loader):
    print(f'Step {step + 1}:')
    print('=======')
    print(f'Number of graphs in the current batch: {data.num_graphs}')
    print(data)
    print()

輸出結果：

Step 1:

=======

Number of graphs in the current batch: 64

Batch(edge_attr=[2560, 4], edge_index=[2, 2560], x=[1154, 7], y=[64], batch=[1154], ptr=[65])

Step 2:

======= Number of graphs in the current batch: 64 Batch(edge_attr=[2454, 4], edge_index=[2, 2454], x=[1121, 7], y=[64],

batch=[1121], ptr=[65])

Step 3:

======= Number of graphs in the current batch: 22 Batch(edge_attr=[980, 4], edge_index=[2, 980], x=[439, 7], y=[22],

batch=[439], ptr=[23])

PyG架構：mini-batch

PyG架構：mini-batch

一、mini-batch

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡