主要内容是一個solver包裝類，主要目的為了實作自己的snapshot。

class SolverWrapper(object):
"""A simple wrapper around Caffe's solver.
This wrapper gives us control over he snapshotting process, which we
use to unnormalize the learned bounding-box regression weights.
"""

def __init__(self, solver_prototxt, roidb, output_dir,
pretrained_model=None):
    """Initialize the SolverWrapper."""
    self.output_dir = output_dir


    if (cfg.TRAIN.HAS_RPN and cfg.TRAIN.BBOX_REG and
    cfg.TRAIN.BBOX_NORMALIZE_TARGETS):

    # RPN can only use precomputed normalization because there are no
    # fixed statistics to compute a priori
    assert cfg.TRAIN.BBOX_NORMALIZE_TARGETS_PRECOMPUTED

    if cfg.TRAIN.BBOX_REG:
    print 'Computing bounding-box regression targets...'
    self.bbox_means, self.bbox_stds = \
    rdl_roidb.add_bbox_regression_targets(roidb)
    print 'done'

    self.solver = caffe.SGDSolver(solver_prototxt)
    if pretrained_model is not None:
    print ('Loading pretrained model '
    'weights from {:s}').format(pretrained_model)
    self.solver.net.copy_from(pretrained_model)

    self.solver_param = caffe_pb2.SolverParameter()
    with open(solver_prototxt, 'rt') as f:
    pb2.text_format.Merge(f.read(), self.solver_param)

    #将roidb設定到net中。
    self.solver.net.layers[].set_roidb(roidb)

snapshot

實作自己的snapshot。

def snapshot(self):
    """Take a snapshot of the network after unnormalizing the learned
    bounding-box regression weights. This enables easy use at test-time.
    """
    net = self.solver.net

    scale_bbox_params = (cfg.TRAIN.BBOX_REG and
    cfg.TRAIN.BBOX_NORMALIZE_TARGETS and
    net.params.has_key('bbox_pred'))

    if scale_bbox_params:
    # save original values
    orig_0 = net.params['bbox_pred'][].data.copy()
    orig_1 = net.params['bbox_pred'][].data.copy()

    # scale and shift with bbox reg unnormalization; then save snapshot
    net.params['bbox_pred'][].data[...] = \
    (net.params['bbox_pred'][].data *
    self.bbox_stds[:, np.newaxis])
    net.params['bbox_pred'][].data[...] = \
    (net.params['bbox_pred'][].data *
    self.bbox_stds + self.bbox_means)

    infix = ('_' + cfg.TRAIN.SNAPSHOT_INFIX
    if cfg.TRAIN.SNAPSHOT_INFIX != else )
    filename = (self.solver_param.snapshot_prefix + infix +
    '_iter_{:d}'.format(self.solver.iter) + '.caffemodel')
    filename = os.path.join(self.output_dir, filename)

    net.save(str(filename))
    print 'Wrote snapshot to: {:s}'.format(filename)

    if scale_bbox_params:
    # restore net to original state
    net.params['bbox_pred'][].data[...] = orig_0
    net.params['bbox_pred'][].data[...] = orig_1
    return filename

train_model

訓練主流程，并控制了snapshot的過程。

def train_model(self, max_iters):
    """Network training loop."""
    last_snapshot_iter = -
    timer = Timer()
    model_paths = []
    while self.solver.iter < max_iters:
    # Make one SGD update
    timer.tic()
    self.solver.step()  #啟動計算過程，SGD梯度下降
    timer.toc()
    if self.solver.iter % ( * self.solver_param.display) == :
    print 'speed: {:.3f}s / iter'.format(timer.average_time)

    if self.solver.iter % cfg.TRAIN.SNAPSHOT_ITERS == :
    last_snapshot_iter = self.solver.iter
    model_paths.append(self.snapshot())

    if last_snapshot_iter != self.solver.iter:
    model_paths.append(self.snapshot())
    return model_paths

get_training_roidb

将roidb中的每張圖檔水準翻轉，并添加回去，以及調用prepare_roidb做了些準備性的工作。

def get_training_roidb(imdb):
    """Returns a roidb (Region of Interest database) for use in training."""
    if cfg.TRAIN.USE_FLIPPED:
    print 'Appending horizontally-flipped training examples...'
    imdb.append_flipped_images()
    print 'done'

    print 'Preparing training data...'
    rdl_roidb.prepare_roidb(imdb)
    print 'done'

    return imdb.roidb

filter_roidb

該函數中定義了一個is_valid函數，用于判斷roidb中的每個entry是否至少有一個前景box或背景box。

roidb全是groudtruth時，因為box與對應的類的重合度(overlaps)顯然為1，也就是說roidb起碼要有一個标記類。

如果roidb包含了一些proposal，overlaps在[BG_THRESH_LO, BG_THRESH_HI]之間的都将被認為是背景，大于FG_THRESH才被認為是前景，roidb 至少要有一個前景或背景，否則将被過濾掉。

def filter_roidb(roidb):
"""Remove roidb entries that have no usable RoIs."""

    def is_valid(entry):
        # Valid images have:
        #   (1) At least one foreground RoI OR
        #   (2) At least one background RoI
        overlaps = entry['max_overlaps']
        # find boxes with sufficient overlap
        fg_inds = np.where(overlaps >= cfg.TRAIN.FG_THRESH)[]
        # Select background RoIs as those within [BG_THRESH_LO, BG_THRESH_HI)
        bg_inds = np.where((overlaps < cfg.TRAIN.BG_THRESH_HI) &
        (overlaps >= cfg.TRAIN.BG_THRESH_LO))[]
        # image is only valid if such boxes exist
        valid = len(fg_inds) >  or len(bg_inds) > 
    return valid

    num = len(roidb)
    filtered_roidb = [entry for entry in roidb if is_valid(entry)]
    num_after = len(filtered_roidb)
    print 'Filtered {} roidb entries: {} -> {}'.format(num - num_after,
    num, num_after)
    return filtered_roidb

train_net

進行網絡的訓練。

def train_net(solver_prototxt, roidb, output_dir,
pretrained_model=None, max_iters=):
    """Train a Fast R-CNN network."""

    roidb = filter_roidb(roidb)
    sw = SolverWrapper(solver_prototxt, roidb, output_dir,
    pretrained_model=pretrained_model)

    print 'Solving...'
    model_paths = sw.train_model(max_iters)
    print 'done solving'
    return model_paths

py-faster-rcnn詳解（3）——train.py接口說明 snapshot train_model get_training_roidb filter_roidb train_net

snapshot

train_model

get_training_roidb

filter_roidb

train_net

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡