天天看點

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

    本文通過一個的實驗,簡要介紹頻域手段添加數字盲水印的方法,并進一步驗證其抗攻擊性。在上述實驗的基礎上,總結躲避數字盲水印的方法。(多圖預警)

本文分為四個部分,第一部分綜述;第二部分頻域數字盲水印制作原理介紹;第三部分盲水印攻擊性實驗;第四部分總結;

一、綜述

本文提供的一種實作“阿裡通過肉眼無法識别的辨別碼追蹤員工”的技術手段。通過看其他答主的分析,阿裡可能還沒用到頻域加水印的技術。

相對于空域方法,頻域加盲水印的方法隐匿性更強,抵抗攻擊能力更強。這類算法解水印困難,你不知道水印加在那個頻段,而且受到攻擊往往會破壞圖像原本内容。本文簡要科普通過頻域手段添加數字盲水印。對于web,可以添加一個背景圖檔,來追蹤截圖者。

所謂盲水印,是指人感覺不到的水印,包括看不到或聽不見(沒錯,數字盲水印也能夠用于音頻)。其主要應用于音像作品、數字圖書等,目的是,在不破壞原始作品的情況下,實作版權的防護與追蹤。

添加數字盲水印的方法簡單可分為空域方法和頻域方法,這兩種方法添加了備援資訊,但在編碼和壓縮情況不變的情況下,不會使原始圖像大小産生變化(原來是10mb添加盲水印之後還是10mb)。

空域是指空間域,我們日常所見的圖像就是空域。空域添加數字水印的方法是在空間域直接對圖像操作(之是以說的這麼繞,是因為不僅僅原圖是空域,原圖的差分等等也是空域),比如将水印直接疊加在圖像上。

我們常說一個音有多高,這個音高是指頻率;同樣,圖像灰階變化強烈的情況,也可以視為圖像的頻率。頻域添加數字水印的方法,是指通過某種變換手段(傅裡葉變換,離散餘弦變換,小波變換等)将圖像變換到頻域(小波域),在頻域對圖像添加水印,再通過逆變換,将圖像轉換為空間域。相對于空域手段,頻域手段隐匿性更強,抗攻擊性更高。

所謂對水印的攻擊,是指破壞水印,包括塗抹,剪切,放縮,旋轉,壓縮,加噪,濾波等。數字盲水印不僅僅要靈活性高(不被人抓到),也要防禦性強(抗打)。就像dota的靈活英雄往往是脆皮,數字盲水印的隐匿性和魯棒性是互斥的。(魯棒性是抗攻擊性的學術名字)

信号是有頻率的,一個信号可以看做是無數個不同階的正弦信号的的疊加。

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

上式為傅裡葉變換公式,是指時域信号(對于信号我們說時域,因為是與時間有關的,而圖像我們往往說空域,與空間有關),是指頻率。想要對傅裡葉變換有深入了解的同學,建議看一下《信号與系統》或者《數字信号處理》的教材,裡面系統介紹了傅裡葉變換、快速傅裡葉變換、拉普拉斯變換、z變換等。

簡而言之,我們有方法将時域信号轉換成為頻域,同樣,我們也能将二維信号(圖像)轉換為頻域。在上文中提到,圖像的頻率是指圖像灰階變換的強烈情況。關于此方面更系統的知識,參見岡薩雷斯的《圖像處理》。

下面以傅裡葉變換為例,介紹通過頻域給圖像添加數字盲水印的方法。注意,因為圖像是離散信号,我們實際用的是離散時間傅裡葉變換,在本文采用的都是二維快速傅裡葉變換,快速傅裡葉變換與離散時間傅裡葉變換等價,通過蝶型歸并的手段,速度更快。下文中傅裡葉變換均為二維快速傅裡葉變換。

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

上圖為疊加數字盲水印的基本流程。編碼的目的有二,一是對水印加密,二控制水印能量的分布。以下是疊加數字盲水印的實驗。

這是原圖像,尺寸300*240 

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

之後進行傅裡葉變換,下圖變換後的頻域圖像,

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

這是我想加的水印,尺寸200*100,

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

這是我編碼後的水印,編碼方式采用随機序列編碼,通過編碼,水印分布到随機分布到各個頻率,并且對水印進行了加密,

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

将上圖與原圖的頻譜疊加,可見圖像的頻譜已經發生了巨大的變化,

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

之後,将疊加水印的頻譜進行傅裡葉逆變換,得到疊加數字水印後的圖像,

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

肉眼幾乎看不出疊加水印後的圖像與原圖的差異,這樣,數字盲水印已經疊加到圖像中去。

實際上,我們是把水印以噪聲的形式添加到原圖像中。

下圖是在空域上的加水印圖與原圖的殘差(調整了對比度,不然殘差調小看不見),

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

可以看出,實際上上述方法是通過頻域添加備援資訊(像噪聲一樣)。這些噪聲遍布全圖,在空域上并不容易破壞。

最終,均方誤差(mse)為0.0244

信噪比(psnr)為64.2db

那麼,為什麼頻譜發生了巨大的變化,而在空域卻變化如此小呢?這是因為我們避開了圖像的主要頻率。下圖是原圖頻譜豎過來的樣子,其能量主要集中在低頻。

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

水印提取是水印疊加的逆過程,

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

經提取後,我們得到如下水印,問:為什麼水印要對稱呢?嘿嘿,大家想想看。

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?
解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

本部分進行攻擊性實驗,來驗證通過頻域手段疊加數字盲水印的魯棒性。

1.進行塗抹攻擊,這是攻擊後的圖檔:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

再進行水印提取:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

2.進行剪切攻擊,就是網上經常用的截圖截取一部分的情況:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

進行循環補全:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

提取水印:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

3.伸縮攻擊(這個實驗明碼做的,水印能量較高,隐匿性不強):

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

提取水印(水印加的不好,混頻挺嚴重的):

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

4.旋轉攻擊(明碼):

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?
解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

5.jpeg壓縮後(這個實驗我好像是拿明碼做的,能量主要加在了高頻):

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

提取結果:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

6. ps 4像素馬賽克/均值濾波等,攻擊後圖像

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

提取水印後圖像:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

7.截屏,

截屏後我手動摳出要測試的圖像區域,并且抽樣或者插值到原圖尺寸:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

測試結果:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

8. 亮度調節(明碼):

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

水印提取:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

9.色相調節(明碼):

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?
解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

10.飽和度調節(明碼):

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

水印:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

11.對比度(明碼):

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?
解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

12. 評論區用waifu2x去噪後圖檔:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

解水印:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

13.美圖秀秀,我對我女票一鍵美顔,美白,磨皮,加腮紅,加唇彩(有一種很羞恥的感覺,捂臉):

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?
解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

14. 對于背景純色的圖其實也是無所謂的

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

能量系數為10時加水印圖檔:覺得太顯噪就把能量系數調低,不過水印的隐秘性和魯棒性是互斥的

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

最終提取出的水印:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

15.我用将rgb>600的像素設定成為(0,255,0)來模拟ps魔術手,

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

提取水印為:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

16.屏攝,好吧,這個實驗我做哭了

屏攝圖:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

實驗結果:

解密:阿裡巴巴公司根據截圖查到洩露資訊的員工的技術是?

我把水印能量系數調整到2000都沒有用。

屏攝之後與原圖信噪比為4db左右,我用多抽樣濾波的方式試過,濾不掉屏攝引入的噪聲。屏攝不僅引入了椒鹽噪聲,乘性噪聲,還有有規律的雪花紋理(摩爾紋)。

基于頻域的盲水印方法隐藏性強,魯棒性高,能夠抵禦大部分攻擊。但是,對于盲水印算法,魯棒性和隐匿性是互斥的。

本文方法針對屏攝不行,我多次實驗沒有成功,哪位大神可以做一下或者讨論讨論。還有二值化不行,這是我想當然的,覺得肯定不行是以沒做實驗。其他的我試了試,用給出的方法調整一下能量系數都可以。

我想大家最關心的是什麼最安全,不會被追蹤。

不涉及圖像的都安全,比如拿筆記下來。

涉及圖像的屏攝最安全,

截屏十分不安全。

繼續閱讀