天天看點

大資料未來的趨勢,這些你必須了解下

2019年,新的大資料概念及技術将陸續浮出市面,老舊技術會逐漸消失,或者出現舊術新用的情況。物聯網的持續壯大為大資料提供了鮮活資源,新技術不僅可以改變商業情報的收集方式,同樣也會改變商業運作的模式……

資料的可通路性衍生出新一代技術,并将商務重頭轉向資料驅動的決策制定。現下,大資料分析已成為收集商業情報的組成部分。許多企業,尤其是線上企業,都認為大資料是主流标配。這些企業馬不停蹄地研究新工具、新模型,以提高他們的大資料使用率。

2019年,一些工具和趨勢将脫穎而出,更受青睐。新的大資料概念及技術将陸續浮出市面,老舊技術會逐漸消失,或者出現舊術新用的情況。物聯網的持續壯大為大資料提供了新的資源,新技術不僅改變了商業情報的收集方式,同樣也改變了商業運作模式。

将物聯網(IoT)串聯至機器學習

目前,相關研究正努力讓物聯網和流分析、機器學習結合起來。2019年,我們可以對這一主題的重大研究翹首以盼,一兩家初創企業有望從事相關服務或軟體營銷。

通常,機器學習使用“存儲”資料在“受控”的學習環境中進行訓練。在新的模型中,物聯網中的流資料提供有用資訊,在一個不那麼“受控”的環境中實時支援機器學習。這個過程的主要目的是重點關注人機交流,讓機器面對各種情況可以作出更靈活更适當的反應。

從一種使用受控環境加有限訓練資料的訓練模型到一個更加開放的訓練系統,需要更複雜的算法。機器學習繼而訓練系統以合理的精度預測結果,随着初級模型的調整和演進,邊緣計算或雲計算中的模型将根據需要進行協調以比對這些變化。MapR(知名大資料企業)的首席應用程式設計師Ted Dunning說:

“我們将看到越來越多的企業以資料流的方式來處理計算,而不是僅僅處理資料并将其存入資料庫。這些資料流捕獲關鍵業務事件并反映業務結構,要建構這些大型的,基于流的系統,統一的資料結構是基礎。”

人工智能平台

大資料作為一種探索工具不斷發展趨向成熟,一些企業是以獲得了可觀回報。最近的一項進展是人工智能平台的使用,人工智能平台将在未來十年産生重大影響。利用人工智能平台處理大資料,是收集商業情報,提高效率的一個重要改進。Anil Kaul,Absolutdata(知名大資料企業)的首席執行官和聯合創始人說:

“我們發起了一個電子郵件活動,我認為每個人都要用到大資料分析,但是通過使用人工智能,如果你對大資料開發感興趣,想系統學習大資料的話,可以加入大資料技術學習交流扣群:458數字345數字782擷取學習資源,我們創造了51%的銷售增長額。當大資料分析找出你的既定目标對象時,人工智能會建議并生成應該發起的活動。”

人工智能平台将在2019年普及。人工智能平台比傳統架構更有效,平台的設計,能夠建立與資料科學家和其他從業人員之間快速、高效的交流方式,多方降低成本,比如防止重複工作、自動完成基礎任務、消除簡單又耗時的内容(複制、資料處理和建構理想客戶檔案)。

人工智能系列還将提供資料治理,為資料科學家和從業人員帶來最佳實踐。人工智能會成為一個值得信賴的顧問,幫助確定均勻分工并快速完成工作。人工智能平台可以分為五層邏輯:

①資料和內建層:提供對資料的通路。(關鍵是,開發人員不會手工編寫規則;相反,人工智能正在“學習”這些規則)

②實驗層:允許資料科學家開發、測試和驗證他們的假設。

③操作和部署層:支援模型管理和部署。這一層提供了管理各種“集裝箱化”模型群組件部署的工具。

④智能層:組織和傳遞智能服務,支援人工智能。

⑤體驗層:旨在通過使用增強現實、對話界面和手勢控制等技術與使用者互動。

資料管理者

2019年,大衆會發現資料管理者(DC)的職位将成為一種新的需要。資料管理者的角色将把管理中繼資料的責任和資料保護、資料治理和資料品質結合起來。資料管理者不僅管理和維護資料,而且還可能參與确定與該資料的最佳工作實踐。資料管理者通常負責示範,資料顯示在儀表闆、圖表或幻燈片的形式中。

資料管理者定期與研究人員進行互動,并安排教育研讨會。在适當的情況下,資料管理者與其他策展人交流合作和協調。Dremio(知名大資料企業)的聯合創始人兼首席執行官

“資料管理者負責了解跨組織中不同組執行的分析類型,什麼資料集适配什麼工作,以及資料消費者将資料從原始狀态轉換為執行形态時所涉及的步驟。資料管理者使用自助資料平台等系統加速端到端的流程,為資料消費者提供對基礎資料集的通路,而非無休止地複制資料。”

政治與《通用資料保護條例》(GDPR)

歐洲聯盟的通用資料保護條例(GDPR)已于2018年5月25日生效。雖然GDPR針對歐洲國家,但一些企業為了簡化業務,促進良好客戶關系,也聲明他們将為所有客戶提供同樣的隐私保護,不管他們來自哪個國家。然而,這種方法并不是歐洲以外的企業群組織所采取的基本立場,許多公司選擇修改他們的同意程式和資料處理流程,并雇傭新員工,這一切做法都是為了使他們“可以”最大化收集私人資料。

所有業務運作都依賴于“假定同意”的企業,在與歐洲人做生意時,不能再做出假定同意了。企業不得不實施通知和征求同意的新程式,許多企業目前正在努力為下一步做計劃,同時也在努力解決目前問題。

一些組織已經将GDPR的責任交給了他們的首席安全官(首席安全官應對這些變化負責)。雖然GDPR的罰款金額可能相當大(罰款金額可能高達2000萬歐元或4%的年度全球營業額,這取決于兩者哪個更高),但許多企業,尤其在美國,仍然沒有準備好。

2019年,美國政府可能會努力模仿GDPR,讓企業對他們如何處理隐私和個人資料負責。從短期來看,線上企業開始實施新的隐私政策,或者幹脆改用GDPR政策模式,都是有意義的。現在,在公司網站上做廣告,有可能與客戶建立良好的關系。

2019年5G不太可能實作

切換到5G(第五代)系統相當昂貴,并且存在一些潛在的問題。雖然高昂的費用可能不會阻擋2019年實施5G的步伐,但其他問題也許會。

雖然美國聯邦政府完全支援實施5G系統,但一些社群已經通過了阻止5G基礎設施安裝的條例,這似乎将成為阻止5G系統的标準做法。

阻礙5G的另一個因素是美國聯邦通信委員會(FCC)的一項決定,該決定取消了支援網絡中立性的法規。網絡中立為網際網路提供商及其使用者提供了一個公平的競争環境,促進公平競争。網絡中立性是指網際網路供應商應該平等對待所有資料和人,不歧視,不根據速度、内容、網站、平台或應用程式向不同的使用者收取不同的費用。

混合雲将或将普及

雲和混合雲一直在穩步增長,并将繼續這樣做。雖然企業可能希望在自己的資料存儲中保持某些資料的安全性,但是混合系統的工具和優點使其值得付出代價。混合雲将企業的私有雲與租用公共雲結合在一起,提供了兩者的優點,預計混合雲的使用将在2019年顯著增加。

一般來說,混合雲中的應用程式和資料可以在本地雲(私有)和IaaS雲(公共)之間來回傳輸,進而提供更多的靈活性、部署選項和工具。例如,公共雲可以用于高容量、低安全性的項目,如電子郵件廣告,而本地雲可以用于更敏感的項目,如财務報告。

“雲爆發”這一術語是混合雲系統的功能,描述了一個運作在本地雲上的應用程式,當該應用程式遇到一個激增的需求(例如聖誕節網上購物,或申請稅等情況),通過“爆發”至公共雲,攫取和利用額外的資源

繼續閱讀