作者:未某人
連結:https://www.zhihu.com/question/24326030/answer/116568697
來源:知乎
著作權歸作者所有,轉載請聯系作者獲得授權。
你知道 zhihu 曾是一家虛假網絡廣告騙子公司嗎?
你知道如何通過一張被裁剪過的圖檔,看到完整圖檔嗎?(美國一位女星是以裸照流出)
你知道如何看被删掉的文章、被關閉的網站嗎?
你想像微網誌 @博物雜志 那樣能夠憑借一張羽毛照片找到該羽毛所屬鳥類的名字嗎?
你知道你的電話、個人經曆、郵箱、住址其實已經不知不覺間被你主動上傳了嗎?
你想找到那個在論壇上和你聊得火熱的網友住哪嗎?
網際網路上有大量半公開資訊,這些資訊一般情況下不會顯示出來,但是它們也沒有被加密或隐藏,你并不需要精通黑客知識就能擷取這些資訊。唯一所需的就是一點小小的技巧。
以下所有内容,根據情況,請自備梯子,自學英語。不再贅言。(以下技巧的用詞描述可能不是百分之百準确,大家明白我意思就好。歡迎在評論中指正)
一. EXIF
你每拍一張照片,你的相機或手機都會儲存大量資訊在照片的 EXIF 中,這些資訊不會顯示在圖檔中,但是内容極其豐富。
對大部分人而言無用的 EXIF 資訊包括拍照時的光圈、ISO 感光值之類的,我也不知道這些到底是啥玩意……
但是 EXIF 中還包含了很多有用資訊——拍照時間、拍照地點的經緯度(開了GPS的手機和部分高端相機可能會包含該資訊)、相機的 Serial 号碼(可以根據該号碼查找到該相機拍的其他照片)、照片的縮略圖等等
我曾經看過一個文章,作者詳述了自己如何通過 EXIF 中的資訊結合地圖軟體,查找到某國産豔照門的拍攝地點……可惜我不記得這個文章說的是哪個豔照門了……
2003年,美國一位女主持人 Catherine Michelle Schwartz 将自己的一張裸照裁剪到隻剩下眼睛,然後上傳到自己的部落格,但是裁剪後的照片仍然保留了完整的 EXIF 資訊,網友根據 EXIF 中的原始圖檔的縮略圖看到了這位女主持人的裸照。
<img data-rawheight="305" data-rawwidth="363" src="https://pic4.zhimg.com/fbb472da452ff588566038c0f3ae8e4b_b.jpg" class="content_image" width="363">

不過,包括微網誌在内的很多社交網站都會自動删除 EXIF 資訊,如果使用了壓縮軟體壓縮圖檔, EXIF 資訊也基本會被删除。而且随着人們的隐私意識提高,很多人會主動想辦法删除 EXIF。但是如果你想查找某張照片的相關資訊,第一步先去查 EXIF 說不定會有意外驚喜
至于如何檢視 EXIF 資訊,随便百度一下,相關網站、軟體很多,我就不啰嗦了。火狐和 Chrome 也有相關插件
另外,我強烈建議大家在任何情況下都要删除圖檔 EXIF 資訊,如果你的手機丢失了,相冊中的照片蘊含的個人隐私遠超你的想象。至于怎麼删除,請百度
二. 搜尋引擎
善用搜尋引擎的各種功能,可以快速找到想要搜尋的内容,甚至能幫你找到普通情況下找不到的資訊
以下以谷歌為例舉幾個例子。
1. 查找個人隐私、網站密碼
很多人在使用社交網站的時候會小心翼翼,盡量不透露自己的個人隐私,殊不知自己的隐私已經在不經意間主動流傳出來了——履歷
網際網路上的履歷資訊可謂是個人隐私大寶庫,上面有你的姓名、頭像、電話、個人經曆等等。
我在寫這個回答的時候,随手在谷歌上搜尋 “履歷 filetype:pdf”(沒有雙引号),即限制隻搜尋 PDF 文檔,找到了一位同學向華為投遞的履歷,上面有電話、郵箱、出生日期、大學學校、工作經驗、愛好遊泳健身,過了六級
如果你直接輸入這個履歷所在網址,隻會顯示 403 Forbidden,然而通過谷歌的搜尋文法,卻可以擷取該履歷
如果你想搜尋具體某個人的履歷,可以試試 “未某人” 履歷 filetype:pdf ,此處雙引号要保留。加上雙引号表示強制搜尋完整詞組,而不是搜尋拆開的 未、某、人三個字。
如果不搜履歷,轉而搜 password 呢?我隻能說很多網站的安全措施(包括很多大型網站)比你想象的薄弱很多
2. 搜尋個人部落格
谷歌原本有提供單獨的部落格搜尋入口,後來和新聞搜尋合并了,入口隐藏得很深。搜尋關鍵詞後,點選 news 分類,點選 search tools,點選 all news 在下拉菜單中點選 blog
除此之外,在 search tools 下還能指定搜尋特定時間段内的部落格、新聞
3. 圖檔搜尋
又回到圖檔這個話題……如果沒有 EXIF 資訊,下一步便可以用谷歌搜尋特定圖檔的類似圖檔。
打開 http://image.google.com,點選搜尋框旁邊的的照相機按鈕,就可以上傳本地圖檔,搜尋類似圖檔<img data-rawheight="198" data-rawwidth="671" src="https://pic1.zhimg.com/5c8ae4e726142bbaed5970e85a637b94_b.png" class="origin_image zh-lightbox-thumb" width="671" data-original="https://pic1.zhimg.com/5c8ae4e726142bbaed5970e85a637b94_r.png">或者直接在搜尋框輸入圖檔位址進行搜尋
或者直接在搜尋框輸入圖檔位址進行搜尋
這個功能用處非常大,例如根據影片截圖搜尋影片名稱、風景照有望找到是何處景點、根據動物照片搜尋動物的名字、找圖檔中明星姓名等等
對某個微網誌微信論壇使用者頭像進行相似圖檔搜尋,或許能找到該使用者在别的網站上的賬号
例如你想找這個美女的名字<img data-rawheight="360" data-rawwidth="480" src="https://pic3.zhimg.com/0e2dab64e15e934e8e4499de83721d32_b.jpg" class="origin_image zh-lightbox-thumb" width="480" data-original="https://pic3.zhimg.com/0e2dab64e15e934e8e4499de83721d32_r.jpg">
通過相似圖檔搜尋,可以輕松查到她是南韓女星 eunsol bambino
除了百度和谷歌提供這個功能外,http://tineye.com 也有以圖搜圖功能。推薦一個火狐插件,叫做 search image everywhere,同時為你在4個搜尋引擎上搜尋某張圖檔的類似圖檔
另外,圖檔搜尋也支援搜尋文法,在 http://image.google.com 上搜尋 site:http://jandan.net/ooxx 可以搜到該網頁包含的所有圖檔
在 http://image.google.com 的 search tools 下你還能搜尋特定大小、特定主色調的圖檔,甚至可以按照有無人像、是否手繪來進行過濾,得到更準确的搜尋結果
另外提醒一下,利用 google image 搜尋兒童色情圖檔的類似圖檔是違反美國法律的,因為這相當于向谷歌散發兒童色情圖檔
更多的搜尋引擎技巧我就不詳述了,推薦一個谷歌搜尋技巧教程和練習網站 http://www.powersearchingwithgoogle.com
三. 找回被删除文章、關閉的網站
網際網路上每天都會有大量文章被删除,大量網站關閉,然而這些文章被删、網站被關之前,很有可能已經被一些網站給存檔了
提供存檔的網站有不少,其中兩個比較出名的是 http://archive.is/ 和 https://archive.org/web/web.php
在 https://archive.org/web/web.php 上搜尋知乎的域名 zhihu.com,發現該網站在2001年2月24号對該域名進行了存檔,原來 zhihu.com 曾是一家叫做智狐機械的公司的企業網站域名
(此處解釋一下,評論中有些同學誤會了。我不是說知乎曾是騙子公司,而是知乎使用的網站域名 http://zhihu.com 曾經是一家疑似為騙子的公司所擁有。這家公司和知乎應該沒有任何關聯)
<img data-rawheight="806" data-rawwidth="635" src="https://pic4.zhimg.com/46ea165555138ac1684ef934abfdf157_b.png" class="origin_image zh-lightbox-thumb" width="635" data-original="https://pic4.zhimg.com/46ea165555138ac1684ef934abfdf157_r.png">
順帶一提,谷歌了一下智狐機械這個詞,第一條傳回結果是新浪的一條新聞,原來智狐機械是“上海市首例網絡虛假廣告案”,“制造了許多虛假的獲獎内容,借此吸引客戶,從事無照經營”
想不到你是這樣的 zhihu
到了2004年,http://zhihu.com 又變成了一個叫做 知乎書坊 的加盟店的首頁(總部在上海)……不知道上海的同學有沒有人對此有印象的。<img data-rawheight="196" data-rawwidth="263" src="https://pic4.zhimg.com/133cf9a2f48ef201274e7a5ee8fa75bf_b.png" class="content_image" width="263">
谷歌也會保留索引過的網頁内容,谷歌上搜尋關鍵字後,點選圖中三角箭頭,再點 cached,就可以看到谷歌在自己的伺服器上保留的該網頁内容,就算該網頁已經被删除,仍然有機會看到網頁内容<img data-rawheight="113" data-rawwidth="613" src="https://pic4.zhimg.com/f7bdf4b06bcf99ed01dc4fc2de3c62df_b.png" class="origin_image zh-lightbox-thumb" width="613" data-original="https://pic4.zhimg.com/f7bdf4b06bcf99ed01dc4fc2de3c62df_r.png">百度也有類似功能,叫做百度快照,大家自己百度一下去了解吧
百度也有類似功能,叫做百度快照,大家自己百度一下去了解吧
答主在悉尼一家中文報社做編輯,曾經在工作時看到一篇英文新聞,說悉尼一家國小釋出了一則新聞簡報(newsletter),要求學生在晨會上不要鼓掌,而是以“原地揮拳”“扭動”“做出興奮的表情”等方法表示激動,以照顧那些對聲音非常敏感的其他同學。該新聞中還配了該簡報的截圖。但是我在該學校官網上卻沒有找到該簡報,不過在谷歌上搜尋 clap site:官網位址 filetype:pdf 後,果然獲得了谷歌在三天前儲存的該簡報,并看到了内容。可以确定是該校在新聞爆出後删掉了該簡報。然而僅僅 1 分鐘不到的谷歌搜尋就讓我找到了原始内容
四、查某站長擁有的其他網站
很多網站都會使用百度統計、google analytics等服務統計網站流量,或使用亞馬遜、谷歌廣告服務賺收入,一個站長擁有多家網站時,往往這些網站會共用一個 google analytics 賬戶,這樣我們便可以據此找到哪些網站其實是同一個人所有
一個比較友善的網站是 SpyOnWeb.com Research Tool。以大名鼎鼎的煎蛋網和小衆軟體為例
<img data-rawheight="132" data-rawwidth="1366" src="https://pic4.zhimg.com/6dee78fc58cf934d07c252eb2ba828ef_b.png" class="origin_image zh-lightbox-thumb" width="1366" data-original="https://pic4.zhimg.com/6dee78fc58cf934d07c252eb2ba828ef_r.png">共有 6 個網站共用一個 google analytics 賬戶,其中
共有 6 個網站共用一個 google analytics 賬戶,其中 http://hox.in 與 http://janbao.net 都是和煎蛋網有關的網站,有趣的是 服裝搭配 - 衣櫥必備單品! 這個網站,是一家天貓導購網站……
和小衆軟體共用一個 google analytics 賬戶的網站有 3 個(不含小衆軟體本身),其中兩個已經無法通路了,但是從域名 http://cancertype.me 還是能看出來是個醫療癌症方面的網站。還有一個還能通路,偉德betvictor1946_m88.com_m88明升備用 該網站與小衆軟體不但共用 google analytics 還共用 google adsense 賬戶。
那這個網站是幹嘛的呢?是一個祛疤醫療網……
我當然很難相信小衆軟體站長還兼職做虛假醫療廣告,其中應該是有什麼技術問題或是誤會我不太了解。
SpyOnWeb.com Research Tool 隻支援搜尋 google analytics 等國外常用的一些服務。如果你感興趣的網站使用百度統計等國内服務,那麼需要懂一點相關知識,在目标網站的 HTML 代碼中找到百度統計賬号 ID,然後去 search.nerdydata.com 這個網站進行搜尋
五、其他
可以擷取普通人難以獲得的資訊的各種亂七八糟小技巧還有很多,例如
- 谷歌地球和谷歌街景可以檢視某地的過往照片
- https://www.freemaptools.com/, 可以在地圖上随意勾選一塊區域然後計算出該區域面積
- Facebook, Twitter, LinkedIn, Instagram 也有很多擷取資訊的技巧,不過這些網站在國内并不存在
- 網際網路上還有一種搜尋引擎叫 people search enging,搜人引擎,隻要輸入人名/郵箱/電話等,就有一定可能找到你的個人資訊,不過這些網站大多依賴各種個人資訊資料庫,是以搜尋到外國人(特别是美國人)的幾率比較大。知乎上有個提問是根據一個手機号能獲得多少資訊,在這些搜人引擎網站上,輸入一個美國人的手機号後,1 分鐘内,說不定他的國小在哪上、國小同學有哪些、目前個人收入大緻範圍都能找到
==========================================================================
哎,我上一個兩千贊的文章是寫英語的,好幾個星期才慢慢到兩千贊,這個回答雖然也預料到會有不少贊,但是24小時内破 2000 贊,我隻能說你們這些愛窺探的寶寶啊~~~~~~
既然如此,我就再更一點吧~~~~~哈哈哈哈哈哈
有些同學在評論中表示我寫的這些内容如果散播開會不會不太好。
同學,當然是不好了……大家都學會了,我就要花更大精力找新的技巧了……
其實這些技巧用在黑客攻擊方面,勉強可以算是社會工程學的基礎内容;如果用在犯罪調查驗證方面,則是 digital forensics 的内容。(維基百科把 digital forensics 翻譯為數位鑒識,感覺是台灣人的翻譯,不是很喜歡,直譯就是數字法醫學,此處法醫不是指檢查屍體那個法醫,而是統稱犯罪調查中用到的科學技術)
給大家推薦一本書,以上我寫的很多内容就是來自這本書
<img data-rawheight="663" data-rawwidth="591" src="https://pic2.zhimg.com/e7664f9821d1ebc409e6f8d33fee0c0d_b.png" class="origin_image zh-lightbox-thumb" width="591" data-original="https://pic2.zhimg.com/e7664f9821d1ebc409e6f8d33fee0c0d_r.png">
《Open Source Intelligence Techniques》,全書都是在教你如何在網上搜尋定位公開資訊(嚴格來說,我覺得應該算半公開資訊)。作者是一位受雇于美國政府的電腦犯罪調查員。全書幹貨滿滿,簡直滿到過頭,每次讀書翻頁都要慢慢翻,以免幹貨太幹着火……
不說别的嗎,這樣一本小衆的書,能出到第五版,就知道内容有多強了。
下面這張圖是作者在書後附的一張流程圖,記錄了如果手頭隻有調查目标的手機号,會用怎樣的步驟在網上搜尋這個手機号的相關資訊。除了手機号外,還有别的流程圖告訴你如果隻有姓名、隻有郵箱 等極少資訊時如何進行調查
<img data-rawheight="5312" data-rawwidth="2988" src="https://pic2.zhimg.com/2ac1c76f6e947cba6b07bb4befc5d691_b.jpg" class="origin_image zh-lightbox-thumb" width="2988" data-original="https://pic2.zhimg.com/2ac1c76f6e947cba6b07bb4befc5d691_r.jpg">
(我拍的這張照片自己都沒有删除 EXIF 資訊,哈哈哈哈。暴露了我在使用三星 NOTE 4 的事實。多謝評論提醒,但是我就不删這張照片了,作為對後來人的一個提醒吧。)
當然了,這本書作者由于是美國人,是以裡面有很多内容是和 Facebook, Twitter 等内容相關。無法直接應用到中國,但是其思路卻是非常有啟發性的。
(有些同學在評論中問我這本書在哪買。我雖然回複了在哪能買到,但是看了上面那麼多内容,想找哪有賣這本書時,竟然還要問我,而不是谷歌,連百度都能找到這本書哪有賣)
============================================================================
一天兩更……感覺自己在寫網絡小說……
大家用谷歌搜尋的時候要注意一個地方,随便搜尋一個詞,然後再搜尋結果頁面右上角點選那個齒輪,然後看看下拉菜單中有沒有 Turn on SafeSearch 字樣
<img data-rawheight="391" data-rawwidth="845" src="https://pic3.zhimg.com/fcc276cd6d80890105afc88b82b8eaca_b.png" class="origin_image zh-lightbox-thumb" width="845" data-original="https://pic3.zhimg.com/fcc276cd6d80890105afc88b82b8eaca_r.png">
SafeSearch 用于過濾含成人内容的搜尋結果,如果下拉菜單中顯示的和我的截圖一樣,是 Turn on SafeSearch,說明這個功能被關閉了;如果是 Turn off SafeSearch,說明這個功能開啟了
至于你到底是想開啟還是關閉 SafeSearch,取決于你自己了。
這個 SafeSearch 功能開啟後也會應用到圖檔搜尋和視訊搜尋上。畢竟如果你是設計師,在公司用谷歌搜圖檔的時候,你也不想半個螢幕的圖檔都是言語不适當描述的内容吧
以下是打開 SafeSearch 後再圖檔搜尋中搜尋 NUDE(裸) 的結果。從結果來看,主要搜尋到的内容恐怕是與 nude makeup(裸妝)有關
<img data-rawheight="946" data-rawwidth="1903" src="https://pic2.zhimg.com/5898142ae6f2d50cc443ccf32b538ea5_b.png" class="origin_image zh-lightbox-thumb" width="1903" data-original="https://pic2.zhimg.com/5898142ae6f2d50cc443ccf32b538ea5_r.png">
以下是關閉 SafeSearch 後的搜尋結果(名譽擔保,絕對沒有打馬賽克,如果你看到馬賽克了,說明你家電腦顯示屏有問題)
<img data-rawheight="946" data-rawwidth="1903" src="https://pic4.zhimg.com/4b867311d26c5c6d2b582beefd53148b_b.png" class="origin_image zh-lightbox-thumb" width="1903" data-original="https://pic4.zhimg.com/4b867311d26c5c6d2b582beefd53148b_r.png">
我建議大家在私密場所使用電腦時,最好還是關掉這個功能(如果你成年了的話),因為你很難判斷它到底給你過濾了哪些内容。
我以 F**K (大家自己腦補中間的兩個字母)為關鍵詞搜尋網頁,開啟 SafeSearch 後把維基百科中的該詞條搜尋結果給過濾掉了,http://dictionary.com 這個字典網站對該詞條的解釋也給過濾掉了,這樣的搜尋結果明顯并不适合大多數成年人
=========================================================================
好吧,既然破 4000 了再寫一點點。
我在上面介紹如何檢視已經被删除的文章、被關閉的網站時提到了一個網站 http://archive.org
http://archive.org 這個網站的内容非常豐富,其自身定位是對整個網際網路進行存檔,是以在上面你能找到很多視訊、音頻、文本等等,而且都已經分類整理過了,可以任意下載下傳觀看。
在這裡,你能找到 1992 年出版的盲文版的 《Playboy》https://archive.org/details/playboybraile00nlsu, 是不是看得很興奮?<img data-rawheight="493" data-rawwidth="911" src="https://pic2.zhimg.com/6de21b6858f41efb70ff3fb1a691d0cd_b.png" class="origin_image zh-lightbox-thumb" width="911" data-original="https://pic2.zhimg.com/6de21b6858f41efb70ff3fb1a691d0cd_r.png">
有 1956 年出版的《新疆綜合考察報告》,還是内部刊物哦
<img data-rawheight="701" data-rawwidth="450" src="https://pic4.zhimg.com/c9a539ed3a9219cbbb5da078e358db4b_b.png" class="origin_image zh-lightbox-thumb" width="450" data-original="https://pic4.zhimg.com/c9a539ed3a9219cbbb5da078e358db4b_r.png">
有對美國内利斯空軍基地指揮官就大名鼎鼎的 51 區進行的采訪的視訊 https://archive.org/details/NellisAfbCommanderDenyUfo-AnthonyJHilder<img data-rawheight="728" data-rawwidth="958" src="https://pic2.zhimg.com/1d4ba3b0ce178a616a434ede2e0eb091_b.png" class="origin_image zh-lightbox-thumb" width="958" data-original="https://pic2.zhimg.com/1d4ba3b0ce178a616a434ede2e0eb091_r.png">
還有美國政府公開過的各種機密檔案,包括美國空軍進行的UFO調查項目 Project Blue Book。
這些資料你隻要用心去找,也許用谷歌都能找到,但是 http://archive.org 幫你整理好了,打包好了。
====================================================================
我之前承諾破 7000 贊後會考慮放個大招,現在破萬贊了……
但是我不是來放大招的,隻是來說一下大招的計劃:
我打算從評論本文的知乎網友中選一名,試着能不能從網上盡我所能挖掘到他/她的個人資訊。然後我會大緻分享一下我的搜尋資訊流程,以及能挖掘到什麼程度的資訊。
以下幾點我要說明一下:
- 我隻是說會試着去挖掘他/她的個人資訊,并不一定會成功,如果第一個人不成功,我會再選一個。總之,如果一直不成功,最多也就試3、4個評論使用者,不太可能試太多(我還是有真實人生要過的)
- 我個人對于能挖掘到多少資訊沒有太大把握,畢竟我并不懂黑客技術,也不太了解社會工程學,而且我所掌握的所有技巧更多隻是理論,實踐不多。是以估計成功幾率不會太高
- 如果僥幸成功,我也不會詳細寫挖掘過程,隻會大概說一說。更加不會詳盡公布我挖掘到的個人資訊,也是隻說大概,例如住址我就隻會說到城市名
- 不會公布我試着挖掘了哪些評論者的資訊
- 我也不确定啥時候會開始這個大招……可能兩三天後把(8月20日前後)
- 放大招之前,這兩天還會再提供一些小招