天天看點

Atitit.論圖檔類型 垃圾檔案的識别與清理  流程與設計原則 與api概要設計 v2 pbj

Atitit.論圖檔類型 垃圾檔案的識别與清理  流程與設計原則 與api概要設計 v2 pbj

1. 倆個問題::識别垃圾檔案與清理政策1

2. 如何識别垃圾圖檔1

2.1. 體積過小檔案<10kb1

2.2. 增加擴充名對于無擴充名檔案1

2.3. 清理非圖檔(bmp,jpg,jpeg,png)的檔案2

2.4. 尺寸過小圖檔(210*150)2

2.5. 清理廣告圖檔(高度寬度不成比例)超長超寬圖檔2

2.6. 清理重複圖檔(此結果不能加入指紋庫)2

2.7. 非本類别的圖檔(人工識别)2

3. 垃圾圖檔檔案指紋庫3

3.1. 根據垃圾檔案指紋庫(模式結果固化)3

3.2. 根據垃圾檔案路徑名稱庫(加快性能比對速度,md5可能比較慢)3

4. 人工識别垃圾圖檔政策3

5. 清理政策3

6. Code3

6.1. 檔案去重4

1. 倆個問題::識别垃圾檔案與清理政策

2. 如何識别垃圾圖檔

2.1. 體積過小檔案<10kb

2.2. 增加擴充名對于無擴充名檔案

package com.attilax.clr;

import com.attilax.clr.imp.MoveExcuter;

import com.attilax.clr.imp.NoPicReconer;

import com.attilax.clr.imp.tooMinSizePicClrerPartImp;

import com.attilax.clr.imp.tooMiniPixPicClrerPartImp;

public class ClrerPicClrer extends ClrerAbs {

public static void main(String[] args) {

ClrerPicClrer c=new ClrerPicClrer();

c.dir="d:\\ati\\isheo";

c.dir="D:\\ati\\p2015\\pic_p";

NoExtnameCheckerImp  neImp=new NoExtnameCheckerImp();

c.PreProcessor=neImp;

c.traveDir(c.dir);

System.out.println("--f");

2.3. 清理非圖檔(bmp,jpg,jpeg,png)的檔案

Gif js 

2.4. 尺寸過小圖檔(210*150)

2.5. 清理廣告圖檔(高度寬度不成比例)超長超寬圖檔

長寬比大于2的圖檔

2.6. 清理重複圖檔(此結果不能加入指紋庫)

部分重複檔案是廣告檔案,是以容易重複

2.7. 非本類别的圖檔(人工識别)

作者:: 老哇的爪子 Attilax 艾龍,  

3. 垃圾圖檔檔案指紋庫

3.1. 根據垃圾檔案指紋庫(模式結果固化)

3.2. 根據垃圾檔案路徑名稱庫(加快性能比對速度,md5可能比較慢)

4. 人工識别垃圾圖檔政策

不好的isho

不能like的pic

誤删除的檔案專門集中放在isho_manu檔案夾中,人工處理

5. 清理政策

生成清理腳本(或者直接java程式模式)

移動到制定檔案夾(推薦)

6. Code

AtibrowPrj

//c.GabFileRecongers.add(new NoPicReconer());

tooMiniPixPicClrerPartImp ClrerPartImp = new tooMiniPixPicClrerPartImp();

ClrerPartImp.dir=c.dir;

ClrerPartImp.targetDir="d:\\ati\\tooMiniPixPic_files";

c.IClrerParts.add(ClrerPartImp);

tooMinSizePicClrerPartImp tmsc=new tooMinSizePicClrerPartImp();

tmsc.dir=c.dir;

tmsc.targetDir="d:/ati/tooMinSize_files";

c.IClrerParts.add(tmsc);

}

6.1. 檔案去重

DeduliAbs_ByMoveToNewFolder.java