天天看點

HBase+Spark技術雙周刊第一期

HBase+Spark技術雙周刊第一期

精彩視訊

HBase多模式

HBase多模式,包括 分析層:支援複雜分析、算子下推;多模式層:提供各種模型轉換,貼切業務;索引引擎:提供索引支援,基于 Lucene ;存儲引擎:提供 KV 支援,基于LSM;分布式檔案層:保障低成本、與上層分離、共享降低成本。本次直播,阿裡雲資料架構師明惠就為大家分享HBase多模式。

HBase核心及能力

HBase核心及能力包括:HBase的特性與生态:自動分區、LSM Tree、存儲計算分離、HBase生态;全新的HBase2.0版本新功能:小對象存儲MOB、讀寫鍊路Off-heap 、Region Replica 、In Memory Compaction 、Assignment MangerV2。在本次直播中,阿裡巴巴技術專家正研就将為大家分享HBase核心及能力。

中國HBase技術社群第八屆MeetUp(南京站) ——HBase應用實踐專場 【教育訓練視訊及資料下載下傳】

2018年11月17号,由中國HBase技術社群、DataFun社群聯合氪空間主辦的中國第八屆HBase Meetup将來到南京,屆時來自阿裡雲、畢馬威、蘇甯等公司HBase的專家們,将為大家分享HBase的應用實踐。

Spark介紹及Spark多資料源分析

開源大資料處理首選Spark,Spark引擎助力資料構架更新,大資料構架分為多種系統,如:流式處理系統、離線分析系統、算法分析系統、互動式分析系統,通過阿裡多模型資料庫專家沐遠的講解學習Spark并解決各種業務問題。

技術博文分享

HBase 在人工智能場景的使用

近幾年來,人工智能逐漸火熱起來,特别是和大資料一起結合使用。人工智能的主要場景又包括圖像能力、語音能力、自然語言處理能力和使用者畫像能力等等。這些場景我們都需要處理海量的資料,處理完的資料一般都需要存儲起來,這些資料的特點主要有如下幾點:大、稀疏、列動态變化。

HBase2.0重新定義小對象實時存取

小對象,特别指1K~10MB範圍的資料,比如圖檔,短視訊,文檔等廣泛的存在于人工智能,醫療,教育,生活分享,電子商務等領域。HBase 2.0在MOB技術的加持下重新定義小對象實時存取,具有低延遲,讀寫強一緻,檢索能力強,水準易擴充等關鍵能力。本文将以一條SQL展開小對象實時存取的方案演進,介紹不同架構的優缺點。然後提供人工智能和醫療方面兩個采用HBase2.0的案例分析。最後總結小對象實時存取的最佳實踐。

消滅毛刺!HBase2.0全鍊路offheap效果拔群

阿裡雲HBase2.0版本是基于社群2018年釋出的HBase2.0.0版本開發的全新版本。在社群HBase2.0.0版本基礎上,做了大量的改進和優化,吸收了衆多阿裡内部成功經驗,比社群HBase版本具有更好的穩定性和性能,同時具備了HBase2.0提供的全新能力。HBase2.0提供的新功能介紹可以參照這篇文章。如果想要申請使用全新的HBase2.0版本,可以在此連結申請試用。

技術社群

【HBase生态+Spark社群大群】

群福利:群内每周進行群直播技術分享及問答

加入方式1:

點選link申請加入

https://dwz.cn/Fvqv066s

加入方式2:

HBase+Spark技術雙周刊第一期

繼續閱讀