天天看點

TORCHVISION.TRANSFORMS包的用法TORCHVISION.TRANSFORMS包中部分類的用法

TORCHVISION.TRANSFORMS包中部分類的用法

  • CLASS torchvision.transforms.Compose(transforms)

    将需要進行變換的操作組合起來 例如

```python
>>> transforms.Compose([
>>>     transforms.CenterCrop(10),
>>>     transforms.ToTensor(),
>>> ])
           
  • CLASS torchvision.transforms.CenterCrop(size)

    在中心裁剪給定的PIL圖像。參數size表示期望裁剪後的輸出的大小。形式為(h,w)或者為一個整數int z(表示輸出為(z,z))。

  • CLASS torchvision.transforms.RandomCrop(size, padding=None, pad_if_needed=False, fill=0, padding_mode=‘constant’)

    對給定的圖像随機裁剪

    Parameters

    size (sequence or python:int)

    形式為(h,w)或者為一個整數int z(表示輸出為(z,z))。

    padding (python:int or sequence, optional)

    預設無填充。如果提供長度為4的序列,則分别用它填充左邊框、上邊框、右邊框和下邊框。如果提供長度為2的序列,則分别用它填充左/右、上/下邊界。

    pad_if_needed (boolean)

    如果圖像小于期望的大小,它将填充圖像以避免引發異常。因為裁剪是在填充之後完成的,是以填充看起來是随機偏移的。

    fill

    像素填充值為常數填充。預設值為0。如果一個長度為3的元組,則分别用于填充R、G、B通道。此值僅在padding_mode為常量時使用。

    padding_mode

    type of padding. Should be: constant, edge, reflect or symmetric. Default is constant.填充的形式設定

  • CLASS torchvision.transforms.ToTensor

    Convert a PIL Image or numpy.ndarray to tensor.轉換為張量

    FloatTensor of shape (C x H x W) in the range [0.0, 1.0] if the PIL Image belongs to one of the modes (L, LA, P, I, F, RGB, YCbCr, RGBA, CMYK, 1) or if the numpy.ndarray has dtype = np.uint8

繼續閱讀