天天看點

《建構實時機器學習系統》一1.6 實時應用對機器學習的要求

現今每年都會發表成千上萬的機器學習相關的論文,其中不乏表現突出的方法論,但是并不是所有的機器學習模型在實際應用中都适用。實時機器學習的應用主要有以下幾個方面的要求。

1.模型可擴充性

模型可擴充性需要整個機器學習應用的各個部分均可以輕易地根據實際需要進行擴充。這裡的擴充可能是增加新的預測變量,也可能是在新的市場、 人群和使用者界面中進行使用,還有可能是加入新的架構部件,進行可視化等操作。

2.模型運用低延遲性

低延遲性是實時機器學習應用差別于其他機器學習應用的核心。根據定的義的不同,低延遲的界定也會有所不同。對于網頁、互動式遊戲等應用場景,低延遲需要整個機器學習背景在少于 10 個微秒内完成反應;與此相對應的是,對于背景資料分析、作弊檢測等場景,低延遲要求整個機器學習背景能在少于一分鐘内完成作業即可。

3.訓練資料私密性

訓練資料私密性是指,模型的使用者能否通過逆向工程的辦法,倒推出模型訓練資料集的内容。如果訓練資料集的内容可以被輕松倒推出來,那麼可能會對訓練集資料提供者的隐私和經濟利益帶來負面影響。這是近幾年剛被機器學習業界意識到的一個重要問題。

繼續閱讀