【51cto.com原創稿件】網際網路發展至今,已經成為人們的必需品。我們無論是在工作還是生活中,都會使用網際網路。在web 2.0時代,使用者原創内容ugc大量出現,然而,一些垃圾資訊、廣告、色情圖檔等内容,正破壞着網際網路的純淨度。
過去,多數企業會采用人工進行内容稽核,然而誤報率較高,成本也很高,随着音頻、視訊等流媒體的出現,内容稽核的難度也越來越大。适應這種需求,網易今年推出了内容反垃圾産品網易易盾,為當下解決網際網路内容垃圾方面提供了新思路和新方法。
内容反垃圾的重要性:規避風險,提升體驗
有資料顯示,僅2016年上半年,我國網民平均每周收到垃圾郵件高達18.9封、垃圾短信數量約為20.6條、騷擾電話更是多達21.3個,緊跟其後的還有惡意電腦廣告彈窗和app推送。而這些隻是在網民體驗層面的影響,對網際網路服務尤其是ugc類産品來說,網絡垃圾的泛濫無疑加重了營運風險。
網易易盾總經理周森
網易易盾的總經理周森認為,網絡垃圾帶來的風險主要集中在兩個方面,一是監管,政策法規的安全,如果ugc産生的内容違反了政策法規,企業就會面臨關閉的風險;二是使用者體驗,如果ugc不稽核,會出現很多廣告、灌水、刷屏等現象,對于使用者體驗來說會造成極大的影響。
既然網絡垃圾帶來如此大的風險,什麼樣的企業需要進行内容反垃圾呢?周森表示,隻要網站上有ugc,就需要稽核,進行内容反垃圾。過去,由于政府的監管壓力,大多數企業都是自己來做内容反垃圾,通過技術+人工稽核的方式實作,成本也相對比較高。
但是,内容反垃圾不是三兩個人就可以完成的。周森告訴筆者,内容反垃圾一般是通過技術手段以及營運的流程制度來保證的,需要一定規模的團隊才能運轉。通常情況下,稽核團隊最少需要7個人員,7*24小時運轉才能保證内容稽核工作完成。而如今,網絡垃圾的形式也多種多樣,除了基本的文本、圖檔,還有視訊、音頻等多媒體形式,内容稽核的難度也會加大,是以,企業不得不重視内容反垃圾。
網易易盾的核心競争力:人工智能+億級特征庫
過去,我們所了解的網易主要是門戶網站、遊戲、郵箱服務,以及網易雲音樂、網易考拉等口碑産品,那麼,為什麼網易要做内容反垃圾的雲服務呢?周森告訴筆者,基于網易十九年對網際網路産品研發體系及營運模式的豐富經驗和深入探索,網易自去年起,已經面向市場推出一系列場景化雲服務,緻力于更好更快地滿足b端客戶業務需求、幫助其解決業務痛點及實作業務目标。而網易易盾是其中的智能反垃圾雲服務,是網易雲計算的一部分,提供廣告過濾、智能鑒黃、暴恐識别及謠言排查等反垃圾服務。
網易易盾的核心思想就是用人工智能的技術,來進行反垃圾過濾,減少企業的人工稽核,降低人工營運成本,以此來規避企業的營運風險,提升産品的使用者體驗。
周森介紹了網易易盾的産品實力:首先是特征庫,基于網易19年的技術沉澱,積累了億級别的特征庫,按照文本和圖檔分類形成不同類别的特征庫,同時還針對每個行業設定專門的特征庫。第二就是技術實力,網易擁有衆多專業的技術人員,也在多年實踐中積累下豐富的技術經驗。
網易易盾的産品共分為四類反垃圾服務,首先是廣告過濾,基于網易郵件反垃圾的智能過濾技術,以及億級廣告特征庫,進行精準過濾;第二是智能鑒黃,基于智能識别及海量樣本庫、信用庫,高效識别色情圖檔;第三是暴恐識别,結合暴恐敏感圖像智能分析技術,快速識别定位暴恐目标圖像;第四是謠言排查,基于樣本庫及專業營運經驗,快速排查謠言等有害資訊。
雲服務模式:saas級産品,便捷調用
過去,網際網路内容以文字為主,是以大家最常用的就是關鍵詞比對的方式進行内容識别。但是,關鍵詞的方式極易産生誤判,對于使用者的體驗也不好,是以,網易易盾進行了技術改進。在文字方面,通過關鍵詞識别、規則引擎、自然語言處理三階段的技術,來保證識别的準确度。周森表示,目前,自然語言處理技術相對使用比較多,畢竟漢語言博大精深,雙關、同音字、多音字等都相對比較複雜,采用自然語言技術可以提高準确度。
網易易盾通過人工智能技術過濾掉垃圾資訊,文本相對過濾速度比較快,圖檔與視訊相對較慢,如果出現争議的判斷,則由人工介入進行再次稽核。那麼,機器過濾的速度有多快呢?周森告訴筆者,依托于網易雲計算資源,網易易盾可以支援單日億級别資料的運算能力,快速響應,實時傳回。目前,網易易盾的準确率已經達到了99.8%以上。
網易易盾是saas級産品,而且使用的門檻也相對較低。主要是調用網易易盾的幾個接口,将内容傳送給網易易盾就可以實時傳回内容的等級,例如垃圾、疑似、正常等。企業的營運人員就很容易的來判别哪些内容是有問題的,并且進行處理。
周森透露,未來,網易易盾将會繼續深耕在網絡安全方面,會在近幾個月推出驗證碼,保護産品的登入注冊過程。
本文作者:鸢玮
來源:51cto