PyG框架：mini-batch

2023-07-02 17:28:00

一、mini-batch

在graph classification的一些基准数据集中，每个图的样本都很小，如果每次只操作一个，不能充分利用GPU资源。所以考虑把它们分成多个mini-batch。

1、原理

mini-batch就是并行处理多个图，这里把多个图的邻接矩阵A1、A2、……拼接成一个大的矩阵，可以看作一个对角矩阵（出现了很多0元素，即稀疏矩阵的存储）

PyG框架：mini-batch

在imgae、language领域中的mini-batch有两种方法：rescaling、padding，把每个样本都处理成一样的size、一样的shape。

但是这两种方法都不适用于graph，会造成很多不必要的内存浪费。

2、代码

PyG框架中的dataloader事先封装好了

from torch_geometric.loader import DataLoader

train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

for step, data in enumerate(train_loader):
    print(f'Step {step + 1}:')
    print('=======')
    print(f'Number of graphs in the current batch: {data.num_graphs}')
    print(data)
    print()

输出结果：

Step 1:

=======

Number of graphs in the current batch: 64

Batch(edge_attr=[2560, 4], edge_index=[2, 2560], x=[1154, 7], y=[64], batch=[1154], ptr=[65])

Step 2:

======= Number of graphs in the current batch: 64 Batch(edge_attr=[2454, 4], edge_index=[2, 2454], x=[1121, 7], y=[64],

batch=[1121], ptr=[65])

Step 3:

======= Number of graphs in the current batch: 22 Batch(edge_attr=[980, 4], edge_index=[2, 980], x=[439, 7], y=[22],

batch=[439], ptr=[23])

PyG框架：mini-batch

PyG框架：mini-batch

一、mini-batch

继续阅读

简单文档分类——朴素贝叶斯算法朴素贝叶斯算法简单文档分类实例步骤总结朴素贝叶斯分类调用(sklearn)

考证大全 | 证券从业资格考试

敲黑板！2021年证券从业考试考点预测

2021年银行从业考试考情介绍,果断收藏!

证券从业合格证书什么时候打印？有哪些注意事项？

【干货满满】初级银行从业考试《个人理财》重点梳理

2020年经济师考试，难吗？

初级银行从业资格证有什么用？

MBA提前面试纯干货分享

MBA值得学么

吴恩达logistic回归实现

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

深度学习模型分析人类复杂疾病的准确性

【趋高机器视觉】机器视觉技术原理解析及解决方案

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络