天天看點

MaxCompute 助力衣二三建構智能化營運工具

摘要:本文由衣二三CTO程異丁為大家講解了如何基于MaxCompute建構智能化營運工具。

衣二三作為亞洲最大的共享時裝平台,MaxCompute是如何幫助它解決資料提取速度慢、資料口徑差異等問題呢?程異丁通過衣二三資料體系架構,從使用者營運應用、商品營運應用以及算法推薦系統三方面給大家剖析了MaxCompute是如何助力衣二三建構智能化營運工具的。

以下是精彩視訊内容整理。

衣二三是誰?

衣二三是亞洲最大的共享時裝平台。衣二三提供女性服飾包月租賃制服務,會員們在APP上挑選喜愛的衣服,可以在平台上用固定的月費在一整月内不斷地換穿衣服,衣二三通過快遞将衣服送到客戶手中,客戶隻要會員期有效,就可以一直穿這件衣服,當會員不想穿的時候,衣二三還會通過快遞按照約定的時間地點将衣服收回,這樣會員就可以繼續下新的訂單,可以不斷地換穿各種衣服。我們的客戶從沒有畢業的學生到工作多年的白領,多種類型的客戶都能從APP上找到合适自己的衣服。

MaxCompute 助力衣二三建構智能化營運工具

如今,電子商務發展非常成熟,線下逛街也是大家喜歡的生活方式,那為什麼在這種情況下還要租衣服呢?衣二三為客戶解決了以下幾個痛點:

1.打開衣櫥總是找不到今天想穿的衣服。使用衣二三,使用者可以靈活的換裝,不斷地嘗試不同風格;

2.費用高。衣二三标準的月費隻有499元,相當于買一件衣服的價格,使用者可以用買一件衣服的價格換穿一整月的不同服裝。

3.大城市的房屋空間有限,擁有一個衣櫥對于很多使用者來說更是奢望。衣二三可以回收衣服,幫助使用者節約空間,同時還負責清洗衣服,正如宣傳語所說的那樣——“你負責貌美如花,我負責清洗收發”;

4.衛生問題。衣二三聯合福奈特、天天洗衣等共同打造了智能化現代化的洗衣工廠,每一件衣服需要經過多達16道清洗消毒流程,比自己家裡洗衣服還要幹淨;

5.購買和退換問題。衣二三通過體驗式的方式幫助使用者從款式、尺碼等方面找到真正适合自己的衣服,并且允許使用者買下來。

為什麼使用 MaxCompute?

衣二三的前後端營運比較複雜,前端需要讓客戶在盡可能短的時間認識我們,了解我們,才能形成轉化;後端也是特别複雜,與一般的電商相比,衣二三有明顯的異同,正常電商的客戶在前端下好單後,會通過訂單管理系統,将訂單派發到倉儲中心,倉儲中心會對訂單進行揀貨、配貨、包裝、物流等,最終将商品送到客戶手中,也可能伴随着一小部分的退貨或返修,對于一般電商來講,整個流程到這裡就基本結束了,但是對于衣二三來說,該流程隻進行了一半,我們需要對所有的衣服進行回收、清洗和質檢,才能夠再次上架讓客戶挑選,如此複雜的營運自然離不開大資料的支援,MaxCompute作為整個資料體系的核心,幫助了衣二三很多。

那麼,在未使用MaxCompute前我們遇到了哪些問題呢?主要包括以下幾方面:

資料提取速度慢。随着系統不斷地變複雜,SQL越跑越慢。

資料口徑差異。每個工程師将邏輯都寫在SQL裡,不同工程師得到的資料結果可能不一樣,這就是因為我們沒有集中化标準化的資料倉庫對每一個資料次元和業務的名額有相應明确的定義,造成所有的邏輯都在SQL中。

Python腳本實作基礎ETL。作業排程與依賴難于維護與疊代,運維也是比較令人頭疼的,修複時間長。

人工資料提取及報表制作。工程師忙于提供各個業務部門的資料支援。

這些問題促使我們想要做出改變,起初我們想做一套完整的hadoop全家桶進行替代,但評估後發現其運維代價和資源消耗對于我們的資料團隊和運維團隊來說,都是比較大的負擔,而且很難快速展現價值。後來,我們很幸運的遇到了MaxCompute,從試用開始,我們逐漸把資料倉庫和資料體系建構在MaxCompute上。

MaxCompute有哪些好處呢?主要從以下幾個次元來分析:

1.MaxCompute是基于雲端的大資料倉庫,無需複雜作業運維工作

2.資料吞吐量大,查詢性能好,支援UDF

3.可視化任務編輯界面,易于上手

4.使用成本低,适合初創公司

5.與阿裡雲大資料産品生态融為一體,比如RDS,應用層的Quick BI,Blink以及日志服務。

如何應用MaxCompute?

MaxCompute 助力衣二三建構智能化營運工具

衣二三資料體系架構如圖所示,最底層是資料源,包括RDS生産資料庫和日志服務等,通過日志服務、DataHub等投遞到資料計算層;資料計算層以MaxCompute為核心,同時配合我們自己做的腳本和UDF進行資料存儲和計算,生成的結果回報到前端資料應用層;資料應用層是資料分析展示工具,包括YConsole、QuickBI以及DataV等,我們使用DataV做展示業務全局的看闆,讓我們快速了解全國各地誰在下單、倉儲中心的儲備情況等。

我們還有包括使用者畫像、商品畫像、爆款識别、衣二三指數和實時人效監控等。

使用者營運應用

MaxCompute 助力衣二三建構智能化營運工具

使用者營運對于網際網路公司來講,都是極其重要的,它有兩個業務名額,一是轉化,一是留存。轉化是指盡快讓客戶了解我們的價值,同時形成付費和轉化;留存是指讓已經成為我們使用者的使用者在平台上得到好的體驗,讓使用者喜歡這種生活方式并留下來。

我們結合了MySQL資料和使用者日志放到MaxCompute中,經過PAI平台,我們自己做了資料分析,包括使用資料挖掘算法和随機森林等的資料次元分析,對我們整個使用者營運做了很多量化名額,我們通過郵件日報對營運名額監控,基于這些名額我們開發了自有使用者分群體系推進使用者精細化營運;基于阿裡雲機器學習計算平台PAI,我們建立了預測模型,預測使用者的轉化率等;引入流失預警計算體系後,營運根據使用者的流失指數進行精準挽留營銷,将會員流失降低了超過50%。

商品營運應用

MaxCompute 助力衣二三建構智能化營運工具

衣二三的每一個商品都有結構化的資料,我們專業的買手會給商品打上20+次元的标簽。此外,我們會總結使用者行為,使用者與商品之間的互動都放在MaxCompute中做相關性分析,形成商品的一系列名額,比如爆款識别,通過爆款識别去預測滿足哪些屬性和次元的衣服會形成爆款,我們的買手會帶着資料工具一起進行采購,極大的提高了營運效率。

我們還結合商品各個表現次元,包括庫存深度、出租情況等計算出衣二三指數,它可以對商品進行排名。除了給合作夥伴應有的租賃收益外,我們還會提供資料工具,最大化業務模式的價值。

MaxCompute 助力衣二三建構智能化營運工具

商品的靈魂就是标簽,隻要将标簽做的足夠細,才能從結構化上去了解它,去做一些預測性的名額。我們通過商品不同的标簽及風格場景熱度指數進行備貨指導,通過最終商品空置率進行商品調撥及庫存關聯,通過衣二三指數反映商品熱度排行,根據使用者行為促進租售轉化,完成商品流動閉環。

算法推薦系統

如何讓使用者在很短的時間内找到适合一個月穿的衣服呢?這就需要推薦算法的支援。

MaxCompute 助力衣二三建構智能化營運工具

衣二三的推薦算法也是基于MaxCompute,把使用者對商品的行為通過日志收集到MaxCompute中,對使用者進行使用者畫像,對使用者畫像進行模型訓練,最終落地到商品清單展示給使用者。使用推薦系統給我們的業務帶來很大提升,選衣頁推薦的點選率增加了70%,人均點選數增加了50%;相關單品推薦的點選率增加了150%,人均點選率增加了110%。

總結下來,大資料的魅力大家已經認識到,MaxCompute這樣的産品對于初創公司來講将大資料門檻降的非常低,讓大資料能夠面向各種各樣的公司來貢獻力量和發揮價值。謝謝在場各位的傾聽,以上就是我的分享。