天天看點

谷歌AI正在吞食一切!爬取所有公開内容用于訓練AI,隐私政策更新

作者:量子位

蕭箫 發自 凹非寺

量子位 | 公衆号 QbitAI

從今往後,你在網上公開說的每一句話,都可能被谷歌拿去訓練AI!

沒錯,繼畫畫之後,文字作品也要被用來喂大模型了——

無論是技術部落格、代碼、論文,還是所有你在網上公開的文章,都可能被扔進“谷歌大模型攪拌機”,即使有版權也是如此。

谷歌AI正在吞食一切!爬取所有公開内容用于訓練AI,隐私政策更新

就在這周,谷歌更新了一版隐私政策,明确表示他們保留有抓取網上所有公開内容,以建構其AI工具的權利。

網友們立刻炸了。有人警告“谷歌正抓取一切”:

一旦谷歌能夠讀取你寫的東西,就意味着這些都是他們的“所有物”了。
谷歌AI正在吞食一切!爬取所有公開内容用于訓練AI,隐私政策更新

還有網友抱持更悲觀的想法:

很快啊,所有内容産出者就都會是AI了。
谷歌AI正在吞食一切!爬取所有公開内容用于訓練AI,隐私政策更新

是以,這版隐私政策究竟是怎麼回事?

用于訓練Bard等AI産品

事情還得從谷歌這幾天更新的隐私政策說起。

在最新的隐私權政策中,谷歌增加了一個關于“研究和開發”的AI模型條款:

Google會利用資訊來改進我們的服務并開發新的産品、功能和技術,以惠及我們的使用者和公衆。

例如,我們會利用公開資訊來幫助訓練Google的AI模型并打造實用産品和功能(比如Google翻譯、Bard和Cloud AI功能)。

換言之,就是将所有可能收集到的公開資訊,用在谷歌翻譯、Bard和Cloud AI等AI相關産品或功能的訓練中。

谷歌AI正在吞食一切!爬取所有公開内容用于訓練AI,隐私政策更新

那麼,這些公開資訊具體包括什麼?

例如網際網路、網絡和其他活動資訊,包括搜尋字詞、應用和浏覽器與谷歌服務進行互動的相關資訊,以及在第三方網站和應用中使用谷歌服務等。

換而言之,不止是此前已經公開的部落格等内容,包括公開到網上的谷歌文檔、或是一些包含個人資訊的發帖,也可能會被谷歌收集起來,用于大模型訓練。

當然,目前這些内容都還限定在“公開資訊”。

像谷歌提供的Gmail等電子郵件服務,應該還是不會被爬進資料裡的。

而且谷歌也明确在隐私權政策中表示,在其他如防範安全威脅、資訊稽核、服務維護、個性化廣告或法律等原因情況下,同樣可以使用這些個人或公開資訊。

不過,谷歌為啥在這個節骨眼更新這個政策?

“AI正挑戰文字版權”

或許也與Reddit和推特等一衆公司搞出的“限流”操作有關。

先是今年4月,Reddit宣布對接入API的公司開始收費。

公司CEO認為,Reddit的資料庫很有價值,但是他們不想将這些有價值的内容免費提供給科技大公司。

随後,推特也開始以“不想讓AI公司白嫖資料”的理由,來給推特限流,未經驗證使用者日浏覽量隻有600,經過驗證後增加到6000。

這一系列政策對使用者和第三方工具影響很嚴重,例如Reddit引發了大規模的讨論版塊抗議,不少版主直接關閉了自己管理的論壇,以對Reddit這一活動進行抗議,推特上也有不少人在聲讨,甚至有網友表示“推特被殺死了”。

但無論如何,讓AI白嫖資料這件事,現在都已經是一個無法忽視的沖突了。

對于谷歌AI爬資料這件事,有網友表示疑惑:

為啥之前網際網路如搜尋引擎也有爬取資料一類的操作,但人們卻偏偏對“AI抓取”感到抗拒。
谷歌AI正在吞食一切!爬取所有公開内容用于訓練AI,隐私政策更新

有網友回應稱:

本質上還是版權的問題。如果隻是引用受版權保護的材料,那麼不一定侵犯版權,但如果用AI對有版權的内容進行“攪拌清洗”,而且這事兒合法化了,那麼本質上版權已死。
谷歌AI正在吞食一切!爬取所有公開内容用于訓練AI,隐私政策更新

也正是是以,他對于這件事感到悲觀:

如果有人在不标注來源的情況下複制了你的部落格,或是将你的開源代碼拿去做付費服務,又或是将你在StackOverflow上的答案用作答題方法,你能接受這些情況發生嗎?

我之前做的一切都是免費的。但現在如果AI想讓我消失,那我就會消失。

谷歌AI正在吞食一切!爬取所有公開内容用于訓練AI,隐私政策更新

當然,也有網友已經接受了這個政策的推出,警惕大家自身防範意識不可或缺:

細讀新政策,注意我們洩露了多少資訊到網上。
谷歌AI正在吞食一切!爬取所有公開内容用于訓練AI,隐私政策更新

那麼,你怎麼看待這件事?

參考連結:

[1]https://gizmodo.com/google-says-itll-scrape-everything-you-post-online-for-1850601486

[2]https://news.ycombinator.com/item?id=36577626

— 完 —

量子位 QbitAI · 頭條号簽約

關注我們,第一時間獲知前沿科技動态