天天看點

“七大屬性加持,三個全新更新元件”這個高性能利器有點厲害

摘要:高性能利器!華為雲MRS ClickHouse重磅推出!

華為雲智能資料湖MRS服務即将上線ClickHouse高性能引擎叢集,使用者隻需要幾分鐘,就可以輕松友善地一鍵式完成叢集部署搭建,快速擁有PB級資料的秒級互動查詢分析能力,幫助使用者帶來極緻的性能體驗!

ClickHouse是最近這兩年非常火的一款開源的分析型資料庫,來自俄羅斯的Yandex公司,2016年開源。它獨立于Hadoop大資料體系,其最核心的特點是極緻壓縮率和極速查詢性能,能為使用者節約大量成本,同時創造更多收益。它提供了相容标準SQL協定的接口,支援JDBC、ODBC驅動,使用C++語言實作。當然它還有個宏偉的目标:成為世界上最快的分析型資料庫,官方測試資料表明,ClickHouse領先Vertica達6倍,領先GreenPlum達到18倍,更是比傳統大資料引擎Hive、Spark等快了上百倍!

ClickHouse是Click Stream + Data WareHouse的縮寫,它起初應用于一款Web流量分析工具,基于頁面的點選事件流,面向資料倉庫進行OLAP分析。現在,ClickHouse被廣泛的應用于網際網路廣告、App和Web流量、電信、金融、物聯網等衆多領域,非常适用于商業智能化應用場景。

在介紹之前,我們首先要有個思維轉變,ClickHouse叢集和通常了解的叢集是有差異的。比方說Hadoop叢集由2個NameNode和多個DataNode組成的完備且獨立的叢集,業務可以直接互動通路;而對于多個ClickHouse節點組成的叢集,它們是沒有中心節點,更多的是一個靜态資源池的概念,業務要使用ClickHouse叢集模式,需要預先在各個節點的配置檔案中定義cluster資訊,等所有參與的節點達成共識,業務才可以正确的互動通路,也就是說配置檔案中的cluster才是我們通常了解的“叢集”概念。

“七大屬性加持,三個全新更新元件”這個高性能利器有點厲害

常見的資料庫系統,隐藏了表級以下的資料分區、副本存儲等細節,使用者是無感覺的,而ClickHouse則要求使用者主動來規劃和定義資料分片(shard)、分區(partition)、副本(replica)位置等詳細配置。它的這種類似“手動擋”的屬性,給使用者帶來及其不友好的體驗,是以MRS服務的ClickHouse執行個體對這些工作做了統一的打包處理,适配成了“自動擋”,實作了統一管理,靈活易用。具體部署形态上,一個ClickHouse執行個體将包含3個Zookeeper節點和多個ClickHouse節點,采用Dedicated Replica模式,資料雙副本高可靠。

“七大屬性加持,三個全新更新元件”這個高性能利器有點厲害

随着業務的快速增長,面對叢集存儲容量或者CPU計算資源接近極限場景,MRS服務提供了平滑的彈性擴容能力,快速的滿足客戶業務增長的訴求。在使用者進行叢集擴容新的ClickHouse節點時,MRS提供了一鍵式資料Balance均衡工具,并把資料均衡的主動權交給使用者,由使用者根據業務的特點,自由決定資料均衡的方式和時間點,以便保障業務可用性,實作了更加平滑的擴容能力。

例如:

把負載高的節點從ELB中摘除,讓負載(新資料)往新節點傾斜;

使用MRS提供的專業化工具重新均衡資料;

資料雙寫老化後自動切換;

“七大屬性加持,三個全新更新元件”這個高性能利器有點厲害

面對鲲鵬生态快速發展,華為雲也提供包含X86、ARM鲲鵬、昇騰在内的多樣計算能力,支援從IOT、大資料、到AI等多種技術,提供最佳的性能、成本效益、能效比。得益于華為雲鲲鵬處理器多核優勢,MRS的ClickHouse叢集也支援華為自研ARM鲲鵬伺服器,充分利用鲲鵬多核高并發能力,提供了晶片級的全棧自主優化能力,同時使用華為自研的作業系統EulerOS、華為JDK及資料加速層,充分釋放底層硬體算力,實作了高成本效益。

MRS服務為使用者提供了統一的叢集管理頁面,并将ClickHouse的執行個體配置向使用者完全開放,使用者可以根據自定義需求,靈活友善的通過可視化頁面修改叢集配置參數,包括增删cluster、macros、storage等資訊。和其他MRS服務元件的配置一樣,ClickHouse配置也分成叢集和節點兩個層面,考慮到ClickHouse引擎特殊性,需要注意不要被覆寫。另外,需要引起特别注意是,有些進階配置建議隻能由“進階”使用者使用,否則可能會導緻系統異常。

MRS服務為使用者提供了基于ELB的HA部署架構,可以将使用者通路流量自動分發到多台後端節點,擴充系統對外的服務能力,實作更高水準的應用容錯。如下圖,用戶端應用請求叢集時,使用ELB(Elastic Load Balance)來進行流量分發,通過ELB的輪詢機制,寫不同節點上的本地表(Local Table),讀不同節點上的分布式表(Distributed Table),這樣,無論叢集寫入的負載、讀的負載以及應用接入的高可用性都具備了有力的保障。

“七大屬性加持,三個全新更新元件”這個高性能利器有點厲害

MRS提供了豐富的ClickHouse叢集監控和告警能力,實時發現系統異常,保障業務穩定運作。使用者可以通過叢集管理Manager的監控頁面實時檢視ClickHouse叢集的運作概況,如健康、配置及角色執行個體狀态統計等名額資訊,同時還可以監控具體執行個體内部運作狀态,包括:實時的讀、寫、資料庫連接配接等多個次元的資訊;此外,MRS還可以與華為雲消息通知服務(SMN)的消息服務系統對接,将告警資訊通過短信或者郵件等形式推送給使用者。使用者可以自定義配置監控與告警門檻值用于關注各名額的健康情況,當監控資料達到告警門檻值,系統将自動觸發告警,将異常資訊以告警形式及時通知到使用者。通過以上能力,MRS可以幫助使用者輕松運維,實時監控,實時發送告警,操作靈活,讓使用者更加省心省力。

MRS提供了VPC網絡隔離、專屬資源隔離、主機安全等完備的安全保障機制,保障了使用者ClickHouse叢集資料通路的安全可靠。具體如下:

VPC網絡隔離:在公有雲部署環境中,MRS通過VPC提供隔離的網絡環境,保證叢集的業務、管理的安全性。使用者可以結合虛拟私有雲VPC的子網劃分、路由控制、安全組等功能,為使用者提供高安全、高可靠的網絡隔離環境。

專屬資源隔離:在面向企業、政府、金融等客戶,MRS提供了計算、存儲資源池以及網絡、管控多級隔離的資源隔離部署方案,為客戶打造了安全可靠、便捷的雲上“頭等艙”。具體模式包括:專屬計算資源+共享存儲資源、共享計算資源+專屬存儲資源、專屬計算資源+專屬存儲資源等三種模式。

主機安全服務:MRS支援與雲上的安全服務內建,針對主機安全服務,做了相容性測試,保證功能和性能不受影響的情況下,增強服務的安全能力,如支援漏洞掃描、安全防護、應用防火牆、堡壘機、網頁防篡改等能力。

此次重磅推出華為雲MRS ClickHouse全新更新大資料元件:

一、MRS 3.0.5版本針對開源元件進行了大面積更新,提供最新能力,并在社群基礎上對功能、性能、可靠性等方面進行了增強。

二、支援建立ClickHouse叢集,具備平滑擴容、HA、鲲鵬加持、靈活配置、簡單運維、安全可靠等能力。

三、本支援單叢集跨AZ部署,提供全元件單叢集跨AZ高可靠能力,保障單AZ故障,核心資料和計算任務不受影響。

我們在華為雲MRS服務上測試了ClickHouse官網的Star Schema Benchmark測試套,硬體配置:3台32 vCPU * 128GB的虛機,1TB的資料集,13個查詢6個在1秒以内傳回,10個在5秒内傳回,全部查詢10秒以内傳回,性能表現非常突出!海量資料分析的低成本案例:

https://altinity.com/blog/2020/1/1/clickhouse-cost-efficiency-in-action-analyzing-500-billion-rows-on-an-intel-nuc 

MRS隆重推出的ClickHouse引擎,快速補齊了MRS服務在大資料實時分析領域的能力。同時相對使用者自建叢集,MRS ClickHouse具備平滑擴容、HA、鲲鵬加持、靈活配置、簡單運維、安全可靠等優勢能力,将會成為使用者在雲上建構高性能海量資料分析倉庫的首選。

同時作為一款新的重量級資料庫引擎,我們還在持續學習和探索過程中,MRS後面會持續從核心、服務化、生态端多個角度進行優化和改進,包括:鲲鵬指令集加速、安全鑒權、SQL診斷、BI工具內建、AI融合進階特性等。

ClickHouse全新規格隆重登場,開年采購季,新年新體驗,最高立省40242元!

“七大屬性加持,三個全新更新元件”這個高性能利器有點厲害

點選關注,第一時間了解華為雲新鮮技術~