公司介紹
流利說是世界領先的科技驅動的教育公司,作為智能教育的倡行者,流利說擁有一支業内領先的人工智能團隊,經過多年積累,流利說已擁有巨型的“中國人英語語音資料庫”,累積實作記錄大約 37 億分鐘的對話和 504 億句錄音。
流利說自主研發了領先的英語口語評測、寫作打分引擎和深度自适應學習系統,從聽、說、讀、寫多個次元提升使用者的英語水準,為使用者提供一整套系統性的英語學習解決方案,截止 2020 年 6 月 30 日,累計注冊使用者達1.856 億。

業務場景介紹
2013 年流利說推出了第一款産品“英語流利說”,內建了語音識别、打分和自适應學習等多種核心技術。具有上下文情景對話、發音指導課程等豐富内容,并提供人工智能英語老師和遊戲化的學習體驗,為使用者在英語學習中獲得更多樂趣。這款有趣又有效的産品很快就占領了當時的市場并獲得了使用者的高度認可。
但業務快速發展,使用者數大幅度增長,平台的使用者數量已從當初的百萬級,增長至過億,是以業務的高低峰期資料流量變化、業務複雜度和分析難度都給給 IT 架構帶來了巨大的挑戰。
業務難點
流利說在面對日常業務需求量以及使用者數量飛速增長的情況下,流利說常常需要面對以下幾個不同的挑戰
不同時段流量變化大,系統需要支援動态請求流量
由于每天不同時段流量變化很大,高峰時段的流量會達到平時的 10 倍,需要系統有足,夠的能力支援動态變化的請求流量,是以對于系統彈性拓展能力,就提出了很高的要求。
産品組合和功能豐富,如何為系統平穩運作提供保障
由于産品組合和功能越來越豐富,對于系統的能夠提供的性能要求不斷增加,大量的付費使用者對于通路體驗有很高的期望,是以需要高可靠、高穩定的系統,來支撐各款産品平穩地運作。
資料量級與應用系統複雜度增加,系統容量和性能成問題
流利說自研口語評測、寫作打分引擎和深度自适應學習系統,每天都需要根據使用者學習情況進行分析,根據每個使用者不同的學習給予評分和指導建議,随着使用者數的增加和應用複雜度的增加,對于大資料系統的容量和性能都有着極高的要求。
阿裡雲資料湖解決方案
針對流利說日常業務對雲服務的彈性、穩定性和大算力的極高要求,阿裡雲為流利說量身定制了一站式資料湖解決方案。
首先,對于資料存儲,流利說的大資料平台使用 OSS 作為資料基礎層,解決了流利說多類資料的統一存儲,同時對接多種計算引擎。而且 OSS 提供了 99.9999999999% (12 個 9)的資料持久性和99.995% 的高可用性,有力的保障流利說的業務穩定和可靠。
在大資料計算方面,通過阿裡雲 EMR 建構大資料計算叢集,提供了包括 Hadoop、Hive、Spark、Presto 在内的多種大資料計算引擎。基于資料湖的存儲與計算解耦合架構,所有計算任務的最終資料都是存儲到 OSS 持久存儲。
同時,阿裡雲資料湖解決方案對開源生态提供非常友好的支援,客戶基于開源架構開發的應用和業務代碼,可以不用修改,直接基于阿裡雲的資料湖解決方案運作。
最後,阿裡雲 VPC 網絡、RAM 等通路控制保障體系,更是為流利說的核心資産“中國人英語語音資料庫” 提供了更可控,更細粒度的安全通路控制保護。
達到的效果
通過阿裡雲為流利說量身打造的資料湖解決方案,解決了流利說多種應用的各類資料的統一存儲,幫助流利說建構資料規模高達上千億的“中國人英語語音資料庫”。使用阿裡雲建構的資料湖,可以充分發揮計算與解耦合架構的優點,結合阿裡雲 ECS 彈性執行個體和 K8S,根據實際業務需求,動态擴充、縮減對應計算資源,無須按照業務峰值常駐計算資源,這種靈活的使用模式,能夠幫助流利說最大程度地優化成本。