天天看點

Linux下如何尋找相同檔案?

雲栖号資訊:【 點選檢視更多行業資訊

在這裡您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!

随着電腦的使用,系統裡将産生很多垃圾,最典型的就是同一份檔案被儲存到了不同的位置,這樣導緻的結果就是磁盤空間被大量占用,系統運作越來越慢。

是以如果你的電腦空間告急的話,可以試着去删除這樣的檔案,釋放一些空間。在 Linux 下,我們可以通過識别檔案的 inode 值來找出系統中的相同檔案。

inode 是一個資料結構,記錄了檔案所有資訊,除了檔案名和檔案内容。如果兩個或多個檔案具有相同的 inode 值,即使它們的檔案名不一樣,位置不一樣,它們的内容、所有者、權限其實都是一樣的,我們可以将其視有相同檔案。

這類型的檔案其實就是所謂的「硬連結」。硬連結具有相同的 inode 值,但檔案名不一樣。而軟連結其實就是快捷方式,它指向目标檔案,但有着自己的 inode 值。

$ ls -l my*
-rw-r--r-- 4 liangxu liangxu   228 Apr 12 19:37 myfile
lrwxrwxrwx 1 liangxu liangxu     6 Apr 15 11:18 myref -> myfile
-rw-r--r-- 4 liangxu liangxu   228 Apr 12 19:37 mytwin           

我們無法直接知道同一目錄下有哪些檔案是有相同的 inode 值,但要識别起來也不難。其實我們隻要使用 ls -i 指令,再以 inode 值進行排序,就可以直接找到這些檔案。

$ ls -i | sort -n | more
 ...
 788000 myfile    <==
 788000 mytwin    <==
 801865 Name_Labels.pdf
 786692 never leave home angry
 920242 NFCU_Docs
 800247 nmap-notes           

在這個結果的第一列裡,就是對應的 inode 值。是以從這個結果裡我們一眼就可以看出來,哪些檔案具有相同 inode 值。

如果你隻是想找到一個檔案的對應硬連結檔案,我們可以使用 find 指令,再加個 -samefile 選項即可快速找到。

$ find . -samefile myfile
./myfile
./save/mycopy
./mytwin           

這些檔案都是有相同的 inode 值,不信的話可以再使用 ls 指令來檢視更多資訊:

$ find . -samefile myfile -ls
 788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./myfile
 788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./save/mycopy
 788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./mytwin           

我們可以看到,除了檔案名之外,這幾個檔案名的資訊完全一樣。細心的朋友可能會注意到,在第2列(硬連接配接數)是4,而實際上我們找出來的檔案隻有3個,這說明還有一個檔案與他們共享 inode 值,隻是我們通過這條指令沒有找出來而已。

作為一個懶人,每次敲指令多麻煩,直接上腳本找出目錄下的相同檔案!

#!/bin/bash

# seaches for files sharing inodes

prev=""

# list files by inode
ls -i | sort -n > /tmp/$0

# search through file for duplicate inode #s
while read line
do
    inode=`echo $line | awk '{print $1}'`
    if [ "$inode" == "$prev" ]; then
        grep $inode /tmp/$0
    fi
    prev=$inode
done < /tmp/$0

# clean up
rm /tmp/$0           

運作結果:

$ ./findHardLinks
 788000 myfile
 788000 mytwin           

當然了,你還可以使用 find 指令,根據 inode 值,找到系統裡所有相同檔案。

$ find / -inum 788000 -ls 2> /dev/null
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /tmp/mycopy
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/myfile
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/save/mycopy
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/mytwin           

在這條指令裡,我們将錯誤提示重定向到 /dev/null 這個特殊檔案裡,這樣在搜尋一些我們沒有權限通路的路徑時,不會滿屏的 permission denied 。

【雲栖号線上課堂】每天都有産品技術專家分享!

課程位址:

https://yqh.aliyun.com/live

立即加入社群,與專家面對面,及時了解課程最新動态!

【雲栖号線上課堂 社群】

https://c.tb.cn/F3.Z8gvnK

原文釋出時間:2020-06-22

本文作者:良許Linux

本文來自:“

掘金

”,了解相關資訊可以關注“掘金”

繼續閱讀