天天看点

Sipakmed:a new dataset feature and image based classification of cervical cells——记一次复现论文经历(二)

3.2 Image Features

cell Features部分要用到SVM和MLP,我不太熟悉就先没做这个实验。

先将这个部分是因为用了数据增强,需要先把所有的数据都准备好,再进行训练测试集的划分。

Sipakmed:a new dataset feature and image based classification of cervical cells——记一次复现论文经历(二)

这一部分说的是对Image Features的训练策略:包括网络、超参数、数据处理等。

  1. CNN网络:VGG19,输入:80*80
  2. 损失函数:cross-entropy loss
  3. 优化器:SGD
  4. 超参数:batch_size = 50, lr = 0.0001
  5. 数据增强:每一张图片 水平、垂直、水平垂直翻转后多了3张,也就是数据增强后的数据集总量是原来的4倍了。

从官网上下好的数据集,图片都是放到了相应类别的文件夹下。

Sipakmed:a new dataset feature and image based classification of cervical cells——记一次复现论文经历(二)

记得改路径!

import cv2
import os
from shutil import copyfile

#要改!!
path = 'your path \\datasets\\sipakmedPics'
classes = os.listdir(path)

for c in classes:
    images_file = os.listdir(path+"\\"+c)

    for i in images_file:
        img = cv2.imread(path+"\\"+c+"\\"+i)

        img1 = cv2.flip(img,1)#水平
        cv2.imwrite(path+"\\"+c+"\\"+i[0:i.index('.')]+"_1.bmp",img1)


        img2 = cv2.flip(img,0)#垂直
        cv2.imwrite(path+"\\"+c+"\\"+i[0:i.index('.')]+"_0.bmp",img2)


        img3 = cv2.flip(img,-1)#水平垂直
        cv2.imwrite(path+"\\"+c+"\\"+i[0:i.index('.')]+"_-1.bmp",img3)

           

这样就实现了每张图片增加三张。

把数据集准备好就到下一步了。

继续阅读