Atitit.論圖檔類型 垃圾檔案的識别與清理 流程與設計原則 與api概要設計 v2 pbj
1. 倆個問題::識别垃圾檔案與清理政策1
2. 如何識别垃圾圖檔1
2.1. 體積過小檔案<10kb1
2.2. 增加擴充名對于無擴充名檔案1
2.3. 清理非圖檔(bmp,jpg,jpeg,png)的檔案2
2.4. 尺寸過小圖檔(210*150)2
2.5. 清理廣告圖檔(高度寬度不成比例)超長超寬圖檔2
2.6. 清理重複圖檔(此結果不能加入指紋庫)2
2.7. 非本類别的圖檔(人工識别)2
3. 垃圾圖檔檔案指紋庫3
3.1. 根據垃圾檔案指紋庫(模式結果固化)3
3.2. 根據垃圾檔案路徑名稱庫(加快性能比對速度,md5可能比較慢)3
4. 人工識别垃圾圖檔政策3
5. 清理政策3
6. Code3
6.1. 檔案去重4
1. 倆個問題::識别垃圾檔案與清理政策
2. 如何識别垃圾圖檔
2.1. 體積過小檔案<10kb
2.2. 增加擴充名對于無擴充名檔案
package com.attilax.clr;
import com.attilax.clr.imp.MoveExcuter;
import com.attilax.clr.imp.NoPicReconer;
import com.attilax.clr.imp.tooMinSizePicClrerPartImp;
import com.attilax.clr.imp.tooMiniPixPicClrerPartImp;
public class ClrerPicClrer extends ClrerAbs {
public static void main(String[] args) {
ClrerPicClrer c=new ClrerPicClrer();
c.dir="d:\\ati\\isheo";
c.dir="D:\\ati\\p2015\\pic_p";
NoExtnameCheckerImp neImp=new NoExtnameCheckerImp();
c.PreProcessor=neImp;
c.traveDir(c.dir);
System.out.println("--f");
2.3. 清理非圖檔(bmp,jpg,jpeg,png)的檔案
Gif js
2.4. 尺寸過小圖檔(210*150)
2.5. 清理廣告圖檔(高度寬度不成比例)超長超寬圖檔
長寬比大于2的圖檔
2.6. 清理重複圖檔(此結果不能加入指紋庫)
部分重複檔案是廣告檔案,是以容易重複
2.7. 非本類别的圖檔(人工識别)
作者:: 老哇的爪子 Attilax 艾龍,
3. 垃圾圖檔檔案指紋庫
3.1. 根據垃圾檔案指紋庫(模式結果固化)
3.2. 根據垃圾檔案路徑名稱庫(加快性能比對速度,md5可能比較慢)
4. 人工識别垃圾圖檔政策
不好的isho
不能like的pic
誤删除的檔案專門集中放在isho_manu檔案夾中,人工處理
5. 清理政策
生成清理腳本(或者直接java程式模式)
移動到制定檔案夾(推薦)
6. Code
AtibrowPrj
//c.GabFileRecongers.add(new NoPicReconer());
tooMiniPixPicClrerPartImp ClrerPartImp = new tooMiniPixPicClrerPartImp();
ClrerPartImp.dir=c.dir;
ClrerPartImp.targetDir="d:\\ati\\tooMiniPixPic_files";
c.IClrerParts.add(ClrerPartImp);
tooMinSizePicClrerPartImp tmsc=new tooMinSizePicClrerPartImp();
tmsc.dir=c.dir;
tmsc.targetDir="d:/ati/tooMinSize_files";
c.IClrerParts.add(tmsc);
}
6.1. 檔案去重
DeduliAbs_ByMoveToNewFolder.java