谷歌隐私政策更新：收集資料會被用來訓練AI

各大科技公司都會收集各種資料，而谷歌一直以來也不例外。谷歌會從使用者的線上活動中收集資料包括搜尋内容、觀看的視訊、購買的物品、交流對象，以及通過安卓移動裝置通路的位置資料。此外，谷歌也在一些情況下會從“可公開通路的來源”手機資訊，例如如果你的姓名出現在新聞中，谷歌可能會索引這篇文章，并與搜尋你名字的人分享。

這些資料收集都是常态，然而近日谷歌釋出了隐私政策更新，變更的部分就是上面所述的公開來源擷取的資訊。此前，谷歌政策規定，這些資料可用于“幫助訓練谷歌的語言模型并建構谷歌翻譯等功能”，而更改後對這一政策進行了擴充。新政策寫道：“我們可能會收集線上公開或從其他公開來源擷取的資訊，以幫助訓練谷歌的人工智能模型并建構谷歌翻譯、Bard 和雲人工智能功能等産品和功能。”

包括 ChatGPT 在内的許多 AI 系統的能力強大與否都取決于它們可以收集的資料量。Bard 是谷歌今年早些時候宣布的對 ChatGPT 的對應産品。和其他 AI 一樣，它的發展并非一帆風順。4 月的一份報道表示，幾名谷歌員工曾敦促公司不要推出 Bard，因為它在回答查詢問題時提供的資訊“比沒有用還要糟糕”，實際上有員工稱它是“幻謊症患者”，即控制不住自己撒謊。

雖然更多的資料可能會讓 Bard 變得更“聰明”，但收集資料用于 AI 訓練這一行為目前依然在法律上有争議：OpenAI 就因其收集和使用資料訓練 ChatGPT 的方式面臨多起訴訟。雖然公開資訊本來就被收集似乎無傷大雅，但是據《華盛頓郵報》稱，AI 模型将會收集包括從維基百科頁面和新聞到個人社交網絡的每條發言在内所有的資訊，而許多人已經對此抱有異議。

此外，資訊太多也意味着一些受到版權保護的資訊會被用來訓練 AI。最近美國作家 Mona Awad 和 Paul Tremblay 就對 OpenAI 提起訴訟，指控 ChatGPT 在未經許可的情況下使用了他們的作品來進行訓練，違反了版權法。