天天看點

零售業如何用Hadoop開啟大資料之門?

在過去幾年,全球零售商一直試圖利用大資料創造價值。由于其大資料分析基礎架構的限制,許多工作被一再推遲。hadoop為這些零售商打開了新的大門,它可以解決他們在過去幾年在大資料領域面臨的許多問題和挑戰。

零售業如何用Hadoop開啟大資料之門?

hadoop:跨多門程式設計語言的大資料解決方案

hadoop背後的技術最初是由google大約在10年前開發的。核心代碼主要是用java編寫的,但有一些是用c編寫的。然而,它運作在一個稱為mapreduce的程式設計模型中,這允許開發人員用其他語言建立新的hadoop代碼。

由于mapreduce環境可以接受不同的程式設計語言代碼,是以它非常通用。它可以提取,分析和操作許多不同來源的大資料。它使用各種算法來進行關聯規則學習,聚類,分類和回歸。這些算法依賴于各種函數,包括貝葉斯,期望最大化和fp-grown算法。

cloudera的首席執行官mike olson表示,hadoop目前仍處于起步階段,但它已經在塑造零售和金融領域廠商使用大資料的方式了。

“hadoop平台旨在解決大量資料(可能是複雜的和結構化的,并且不能很好地融入表中的資料)的混合問題。它适用于深度和計算量大的分析,例如聚類和定位...在線上零售中,如果想為客戶提供更好的搜尋答案,以提高使用者的購買欲望,hadoop可以很好地解決這一問題。

sears控股公司分部副總裁aashish chandra表示,hadoop已經幫助公司降低了營運成本,提高了銷售額。chandra說,以前的大資料提取工具缺乏他們所需要的功能。

使用hadoop挖掘銷售點大資料

銷售點資料在零售業中起着非常重要的作用。公司依靠銷售點大資料來預測未來銷售,管理庫存和項目人員需求。

有許多銷售點工具可以聚合銷售資訊并将其存儲在大資料集中。然而,零售商難以用正常工具從pos中挖掘大資料,即使它就存儲在sql資料庫中。hadoop使零售商更容易從客戶資料庫通路資訊,此資料可以轉換為其他格式,并與其他檔案中的資料集合并。

new horizons clc的john soto聲稱hadoop是零售業主要的改變者。

“大型零售商永遠不可能利用其傳統的大資料基礎設施進行這種分析。存儲如此多的曆史資料是十分昂貴的,并且資料類型複雜,并且需要相當多的準備以允許它與pos事務組合。hadoop解決了這兩個問題,并且可以運作比舊系統更複雜的分析。”

hadoop可以讓零售商預測分析挑戰

hadoop消除了零售商在利用大資料方面的一些障礙。這裡有一些該技術帶來的好處:

零售業如何用Hadoop開啟大資料之門?

1、資料挖掘能力強。許多零售商都存儲了tb級别的資料。這些資料集往往難以提取,因為它們有很深的嵌套。hadoop有非常複雜的索引算法,是以它可以提取以前無法為大資料應用程式使用的資料。

2、與不同的資料格式相容。零售商以許多不同的格式存儲資料。内部财務資料通常存儲在.csv檔案中。零售商一直在努力進行審計,因為他們無法比較結構化和非結構化資料集的資料。hadoop可以提取多種格式的資料,進行分析并以更具凝聚力的形式呈現,它使大資料分析專家能夠從多個來源的資料集之間尋找相關性。

零售商已經發現了使用hadoop的好處:

1、staples使用hadoop分析大資料和預測未來的銷售,這有助于他們更有效地配置設定資源給人員和庫存。 據報道,自使用hadoop以來,staples的促銷成本降低了25%。

2、亞馬遜使用hadoop來改進欺詐檢測模型。據報告,他們将信用卡欺詐減少了50%,因為他們可以更容易地識别出信用不佳的人。

3、相比之前,brands可以得到更詳細的客戶資訊,這有助于他們改進營銷政策。使用hadoop和預測分析的零售商的銷售額增長了73%。

零售商隻是開始認識到hadoop和大資料的潛力。根據dezyre所說,hadoop最大的優勢之一是它可以幫助零售商實時識别和應對挑戰。這對防止欺詐尤其重要,因為罪犯總是在考慮新的騙局。

“操縱者總是在發明新的欺詐工具和技術,零售商必須使用零售分析來識别欺詐活動,防止它們再次發生。使用大資料技術(如hadoop,mapreduce和spark),可以對超過50 pb的資料執行分析,以準确預測潛在風險。”

本文轉自d1net(轉載)