AI—資料中毒

2023-08-07 17:03:51

标題資料中毒

原文連結：https://thenextweb.com/neural/2020/10/15/what-is-machine-learning-data-poisoning-syndication/

通過對上面這篇文章的閱讀，以及公衆号内的講解，以下淺談我對資料中毒的了解。

我了解的資料中毒，舉一個簡單的例子就是說：我們給很多張某種類型的照片給計算機訓練，我們希望得到的結果是，當再給同一種類型的照片給計算機的時候，他可以識别出目前的照片就是該類型的。例如，三站狗狗的照片給計算機訓練，當拿另一隻狗的照片時，可以告訴我們這張照片上的動物是狗狗，而不是其他的。讓計算機可以向我們人眼一樣，判斷改照片中的内容。但是訓練的結果有時候并不如意，例如：假設我們拿給計算機訓練的所有照片中的右下角都有一個相同的标簽，那麼計算機就會誤認為，右下角帶有這個标簽的圖檔就是對應的狗狗圖檔，那麼這時，我如果拿了一張貓的照片，右下角同樣帶有相同的标簽，那麼這張貓的照片就會被計算機了解成狗狗圖檔，這樣就照成了錯誤。

以上問題的關鍵是，機器學習模型會鎖定強相關性，而不是尋找特征之間的因果關系或邏輯關系。而這一特點，可能會被惡意利用，反過來成為攻擊自身的武器。

然而，“資料中毒”并不是要在訓練模型的參數中找到問題的關聯性，而是要通過修改訓練資料，故意将這些關聯性植入到模型中。使系統識别出現錯誤，讓入侵者繞過識别，帶來了很大的危險。

以上是我的一些了解，如果有錯誤的地方，希望大家多多指出，謝謝。

AI—資料中毒

标題資料中毒

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普

AI—資料中毒

标題 資料中毒

繼續閱讀

标題資料中毒