【導讀】最近,脈脈上有人爆料稱,位元組跳動一名實習生删除了公司所有lite模型,随後話題引發熱議。實習生不小心删庫,應由誰來負責?
昨天,在脈脈“我來爆個料”話題下,有人爆出「位元組跳動一實習生删除公司 GB 以下所有機器學習模型」。
一時間話題引起無數程式員圍觀。
lite模型指的是輕量級的模型,全稱TensorFlow Lite,是一種用于移動端裝置深度學習的模型。例如分類,分割的相關模型都很小,很多非常有用的模型都屬于輕量模型。
輿論中,有人為實習生的「去留」擔憂:
也有人為該同學抱不平:
還有吃瓜群衆言,「在位元組删位元組,在頭條上頭條。」
那麼言歸正傳,這個應該有誰來負責?事情的嚴重性又是幾何呢?
影響到底大不大?
該樓主評論表示,管理的給子目錄加了保護,但是實習生直接删除的是hdfs,還加了 skip trash(删除預設到trash,相當于windows的徹底删除)。
不過有人表示,模型都是離線資料,對線上影響不大。
還有人認為,「說明輕量模型确實沒前途了,大規模預訓練模型卷起來。」
據傳聞,還有傳言删了以後,連事故處理群都加了三百多個人。更有員工為了修複加班到3點!
不過,吃瓜群衆最關心的莫過于「責任問題」。畢竟,一個實習生能夠删除模型,ta的權限何來的呢?
有人爆料稱:該實習生實際上不是「手滑」,更不是「手抖」,而是多方問過才下次操作的……
更多的人認為:這鍋80%應該判給管理者!
還有人結合近期「位元組大小周加班問題」調侃了一下:
權責問題引來讨伐聲
問題引發了網友對權責問題的讨論。
據知乎,事故的原因是實習生清理HDFS上的目錄,發現一個目錄最近更新時間是3月份,就以為這個不用了,多方求證之後得到了這個目錄已經沒用的結果(絕了),然後删掉了……
直到一個小時後有人發現模型上線不了……
在很多大公司,模型跑完後會放到Hadoop。
但實際上,權限管理目錄是個大學問,需要一套大流程。
有人提議,這種情況後續權限控制,或者把skip trash弄掉,或者盡可能把權限拆分到各自的模型上。
總之大部分網友認為,一個實習生不應該承擔太多的責任!
其實類似事情還有較為狗血的——2019年AI删庫,程式員背鍋!
2019年,美國版大衆點評Yelp訓練了一個用來消除 bug 的神經網絡,萬萬沒想到,該網絡删除一切,從根本上徹底了實作“bug-free”.
最後,可憐的工程師背了鍋。
不小心删庫是一種怎樣的體驗?
據說,程式員一生會删三次庫。
在話題「不小心删庫是一種怎樣的體驗?」下,很多人都發表了當年的經曆。
比如這位答者:實習的時候删過測試庫……
再比如:那感覺天塌下來一樣!
還有網友表示:「一輩子難忘!」
多年前(2001年),那還是unix字元界面,半夜我例行維護,我删過一個包含二十萬本圖書的庫…………十分鐘後我确認我出錯後,我開始冒汗,胃部像是被猛打了一拳開始痙攣,疼的我都坐不住。
好一會我去過道抽了兩根煙,才回憶起前天做了全系統備份,丢的資料不多!
當然,惡意删庫的現象也不在少數。
2020 年 2 月微盟員工惡意破壞公司資料,讓微盟的市值一天之内蒸發了超 10 億元。不久前,鍊家網一名員工惡意删除了公司 9TB 資料,造成公司财務系統伺服器應用程式出現故障無法登入。不過,這種嚴重的惡性事件,都讓他們受到了法律的審判。
不過,如果此次位元組lite模型删除真的沒影響線上,某種程度上,這還及時暴露了問題,甚至可能避免了以後更大的錯誤。
參考資料: