python自動化辦公：批量去除電腦中的重複圖像

2024-05-21 12:00:00

在數字化時代，我們經常會遇到圖像檔案大量堆積的情況，其中不乏重複的圖檔。這些重複的圖檔不僅占用了寶貴的存儲空間，還使得檔案管理和備份變得繁瑣。為了解決這個問題，我們可以利用Python編寫一個腳本來自動檢測和删除重複的圖像檔案。

準備工作

在開始編寫代碼之前，我們需要確定已經安裝了Python環境，并安裝了一個用于比較圖像相似度的庫，如imagehash和Pillow（PIL的分支）。這兩個庫可以幫助我們生成圖像的哈希值，并基于這些哈希值來比較圖像的相似性。

你可以使用pip來安裝這兩個庫：

pip install imagehash pillow

編寫代碼

下面是一個簡單的Python腳本，用于查找并删除重複的圖像檔案：

import os  
import imagehash  
from PIL import Image  
from itertools import combinations  
  
def image_hash(file_path):  
    hash_object = imagehash.average_hash(Image.open(file_path))  
    return hash_object  
  
def find_duplicate_images(directory):  
    images = [f for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f)) and f.lower().endswith(('.png', '.jpg', '.jpeg', '.gif', '.bmp'))]  
    hashes = {f: image_hash(os.path.join(directory, f)) for f in images}  
      
    duplicates = []  
    for img1, img2 in combinations(images, 2):  
        if hashes[img1] - hashes[img2] < 5:  # 設定一個門檻值來判斷是否相似  
            duplicates.append((img1, img2))  
      
    return duplicates  
  
def remove_duplicates(directory, duplicates):  
    for img1, img2 in duplicates:  
        # 假設我們保留第一個檔案，删除第二個檔案  
        os.remove(os.path.join(directory, img2))  
        print(f"Removed duplicate: {img2}")  
  
# 使用示例  
directory = 'path/to/your/image/directory'  # 替換為你的圖像目錄  
duplicates = find_duplicate_images(directory)  
remove_duplicates(directory, duplicates)

注意：這個腳本使用了簡單的平均雜湊演算法來比較圖像，并設定了一個門檻值（在這個例子中是5）來判斷兩個哈希值是否足夠接近，進而認為圖像是相似的。然而，這種方法的準确性可能因圖像品質和内容的複雜性而有所不同。你可能需要根據你的具體需求來調整這個門檻值。

此外，這個腳本會删除所有相似的圖像中的第二個圖像，保留第一個圖像。如果你想要更複雜的邏輯（例如，隻删除完全相同的圖像，或者基于某種政策來選擇要保留的圖像），你需要在remove_duplicates函數中添加更多的邏輯。

最後，這個腳本并沒有提供備份或撤銷删除的選項，是以請確定在運作腳本之前備份你的圖像檔案，以防止誤删除重要檔案。

代碼實戰

我有一批圖檔，每張圖檔都被備份了兩次，利用以上代碼識别出重複圖檔

删除圖檔後，所有的圖檔都隻剩下一張原圖

python自動化辦公：批量去除電腦中的重複圖像

準備工作

編寫代碼

繼續閱讀

怎麼使用PowerShell遠端連接配接電腦？

華碩破曉6 Pro正式開售！全新Lunar Lake處理器為你智啟AI辦公輕體驗！

杜偉偉到園區黨政辦公室調研

阿爾托的冒險有電腦版嗎？電腦版安裝攻略帶你輕松上手！

我在末世開超市：新秩序有電腦版嗎？電腦版安裝攻略帶你上手！

中國電腦字型管理軟體行業研究報告

中國電腦主機闆行業市場運作态勢及投資規劃分析報告

2024-2030年中國電腦晶片行業市場行情監測及發展趨向研判報告

中國電腦遙控灌腸整複儀行業市場競争态勢及發展前景研判報告

石破茂艱難起步！日本執政黨總部被扔燃燒瓶，首相辦公室被車撞

辦公室裡90%的妹子都滿意的【字母少女内褲】29.9元6條！純棉抑菌底檔，透氣不悶熱！高彈輕薄，不夾臀不勒腰，無痕親膚！

聊一款“沖擊高端”的筆記本電腦

中央采購電腦，華為被淘汰，美企中标千萬，為何美普惠會成功入圍

零刻SER9 Pro×銳龍AI 9 365：AI世代的迷你電腦！

當年曝光1400張照片，毀了陳冠希張柏芝的電腦維修員，下場怎樣？

2025年度顯示器巅峰對決：辦公之王VS遊戲霸主