天天看點

RestCloud新一代(智能)全域資料內建平台釋出

作者:RestCloud

5月18日,RestCloud在其成立六周年的當天,釋出了“新一代(智能)全域資料內建平台”。

RestCloud新一代(智能)全域資料內建平台釋出

5月18日,RestCloud在其成立六周年的當天,釋出了“新一代(智能)全域資料內建平台”。

根據業内專家、學者和從業者通過實踐和研究總結,資料內建大體可以分為4個階段:早期階段、資料內建軟體工具、企業級資料內建平台、現代資料內建平台。

RestCloud新一代(智能)全域資料內建平台釋出

資料內建平台經曆了從手動方式到自動化工具再到企業級資料內建平台的發展曆程,現代資料內建平台已經成為企業數字化轉型的重要工具之一。

一、資料內建平台的新發展方向

随着人工智能的不斷發展,資料內建平台将向資料內建智能化邁進,RestCloud認為"智能+資料內建"将開啟資料內建的第五階段。尤其是以ChatGPT為代表的新的生産力革命的出現,為資料內建技術的發展和應用帶來了新的機遇和挑戰。

GPT不僅對資料分析領域産生了重大影響,對資料內建領域同樣有着重要的影響。GPT的出現與RestCloud一直強調的業務使用者能夠自主建構資料管道的理念是一緻的,GPT使得業務使用者建構資料管道成為現實。

随着GPT大模型的發展,資料對于企業來說将變得更加重要。資料內建平台不僅可以為GPT提供訓練資料,還可以實作資料的自動化訓練和驗證。同時GPT的發展又會反過來促進資料內建平台易用性的降低。

而資料內建平台未來的發展方向至少展現在以下9個方面:

RestCloud新一代(智能)全域資料內建平台釋出

人機協作和智能輔助:資料內建平台結合GPT大模型技術,實作人機協作和智能輔助功能。例如,通過自動化的資料映射和轉換,智能推薦資料內建方案,提供智能化的資料內建建議和優化政策,進而提升使用者的工作效率和資料內建的品質。

智能化資料內建:利用人工智能技術,使資料內建過程更加智能、自動化,降低使用者的工作負擔,提高效率和準确性。

自助式資料管道建構:賦予業務使用者能力,讓他們能夠自主建構、管理和維護資料管道,實作更靈活、快速的資料內建。

大模型內建:內建更多先進的大模型技術,如ChatGPT,以增強資料內建平台的智能化和自動化能力,提供更強大的資料處理和分析功能。

資料品質管理:資料內建平台依賴GPT的能力将更有利于提供更高的資料品質管理能力,包括資料清洗、資料驗證和糾錯等方面。通過提供資料品質監控和管理功能,智能幫助使用者發現和解決資料品質問題,確定資料的準确性和可信度。

資料安全和隐私保護:随着資料內建的不斷增加,保護資料安全和隐私成為至關重要的方向。資料內建平台通過使用GPT技術來加強資料的安全性,采取有效的隐私保護措施,確定資料在內建過程中得到充分的保護和合規處理。

RestCloud新一代(智能)全域資料內建平台釋出

多源資料及應用內建:随着混合雲的發展,企業的資料來源将更加多樣化,多源資料內建成為一個重要的發展方向。資料內建平台需要具備能夠連接配接、整合和處理多種資料源以及應用的能力,包括結構化資料、非結構化資料、實時資料等,進而實作全域資料內建。

實用性和商業價值:注重研發實用性和商業價值的産品和解決方案,滿足使用者需求,解決實際業務問題,幫助企業實作資料內建的目标。

可擴充性和靈活性:随着資料規模和業務需求的增長,資料內建平台需要具備良好的可擴充性和靈活性。它應該能夠适應不斷變化的資料環境和業務需求,支援快速內建新的資料源和應用,同時具備良好的可定制性和擴充性,以滿足不同企業的特定需求。

RestCloud的願景是全方位降低使用者使用門檻,讓業務人員能夠像專業的資料工程師一樣玩轉資料,使資料成為更進一步的生産力提供支撐。

經過一年多的持續疊代,RestCloud的最新産品(智能)全域資料內建平台,內建了ChatGPT技術,為客戶提供更加智能化的資料內建解決方案。未來,RestCloud還将內建更多的大模型,不斷提升平台的智能化水準。

二、新功能介紹

新一代(智能)全域資料內建平台除內建ChatGPT技術,在功能上做了大量的優化工作。1、重構資料處理元件,讓資料處理元件操作更合理,效率更高。2、重構了整個資料內建社群,建構一個更利于大家交流和探讨的社群。3、推出資料處理元件生态,該生态不僅包括元件開發工具,RestCloud還提供最新研發的幾百個資料處理元件和流程模闆,內建了大量的主流業務系統和SaaS應用,接下來,RestCloud還會不斷的內建更多應用群組件。

新一代(智能)全域資料內建平台主要7項重大更新:包括3個新增加功能和4項優化

新增加功能為:

1、智能建構資料管道

自然語言互動智能建構資料管道不但是使用者的夢想,也是資料內建平台研發人員的夢想,雖然拖拽式資料管道建構已經大幅降低了資料管道的建構成本,但是相對于自然語言互動即可以讓AI智能幫助我們建構資料管道仍然存在較大的體驗差距,而新一代(智能)全域資料內建平台深度容入了ChatGTP的人工智能技術,普通業務使用者通過簡單描述需求我們即可幫助使用者建構出資料管道,寫SQL、優化SQL、建構資料管道,寫腳本、自動實作資料映射等能力。

通過以下這些業務場景,看下內建ChatGTP的資料內建平台是如何智能建構資料管道:

讀取存儲城市資料表、存儲國家資料表,變更将兩種表記錄合并,輸出亞洲和歐洲國家的所有城市,并将結果儲存到指定的資料庫。

打開流程設計器,打開AI對話框,通過自然語言描述任務,自動生成任務任務流程。

1.讓ChatGPT根據客戶資料自動編寫郵件并發送

2.讓ChatGPT自動幫我們格式化資料并形成報表發送出去

3.讓ChatGPT自動幫我們分析資料并進行彙總

4.讓ChatGTP幫我們把資料進行對比分析找出差異并自動發送給業務人員

5.自動化生成GPT所需要的訓練資料,自動進行微調訓練

更多的應用場景我相信我們的使用者将了解的比我們更多…

2、分鐘級資料服務釋出

在最新版本中,RestCloud憑借在API領域的強大技術實力,為資料內建平台帶來了優越的資料服務解決方案。

借助RestCloud專業的API低代碼開發平台,僅需幾分鐘,即可建構強大的資料即服務平台(DaaS),為業務提供快速、高效的資料支援。

3、相容遷移kettle

在不斷的在探索中,RestCloud深知,目前使用kettle的使用者都要經受資料內建平台出現故障不能告警的痛苦,但卻苦于找不到一款能真正替換kettle的etl工具,而今天RestCloud宣布通過融合GPT技術,已經實作了大部分kettle流程的無縫遷移到RestCloud資料內建平台,在接下來的版本,RestCloud就會推出kettle流程遷移工具。

優化功能為:

1、毫秒級實時同步

在CDC實時資料同步領域,RestCloud進行了重大更新,大幅提升了性能和使用者體驗,同時修複了之前版本存在的問題。

1.極高的性能:通過優化算法和技術,RestCloud實作了毫秒級實時資料同步,使資料能夠以更快的速度從源系統到達目标資料倉庫。使用者可以即時擷取最新的資料,支援實時分析和決策。

2.輕量化部署:相比其他實時資料內建平台,RestCloud的CDC實時資料同步解決方案非常輕量化,無需依賴複雜的元件如Kafka。這降低了系統的複雜性和運維成本,讓使用者能夠快速搭建實時資料內建環境。

3.靈活的資料源支援:RestCloud的CDC實時資料同步能夠與各種主流資料源無縫內建,包括常見資料庫、MQ、API等。

4.可靠的資料一緻性:CDC平台RestCloud重新設計了資料的一緻性和完整性保障方案,確定在實時同步過程中資料不會丢失或損壞。

5.簡化的操作和管理:使用者能夠快速配置和監控實時資料同步任務。無論是設定同步規則還是監控同步狀态,都能以直覺的方式完成,減少了使用者的學習曲線和操作難度。

CDC實時資料同步能力能夠幫助使用者輕松建構實時資料倉庫,并實作高效、可靠的資料內建。

2、離線資料傳輸性能優化

此外,RestCloud的資料內建平台經過大量的性能對比測試,展現出了無與倫比的速度和效率。

通過先進的自動分片和多通道并行傳輸算法,RestCloud能夠使資料內建變得更快、更穩定。無論是批量資料處理還是實時資料同步,都能以閃電般的速度滿足使用者的需求。RestCloud資料內建平台與DataX、Kettle進行從MySQL傳輸到MongoDB的資料對比測試中,RestCloud分别用100萬、500萬、1300萬、2000萬資料量進行多次壓測,RestCloud資料內建平台平均比Kettle快26%。

RestCloud新一代(智能)全域資料內建平台釋出

3、ETL/ELT/CDC/排程/API釋出一體化架構整合

在資料內建同步任務中,選擇ETL、ELT還是資料中台一直是個令人猶豫的選型問題。如今,RestCloud的平台為您提供了一個全新的解決方案,将ETL、ELT、CDC、和API釋出內建到一個統一的平台上。

無論需要進行資料抽取、轉換和加載,還是希望在目标系統中進行資料處理和分析,RestCloud的一體化架構可以根據具體需求選擇ETL或ELT的方式,同時結合CDC實作實時資料同步,通過靈活的排程功能實作任務的自動化管理,還可以友善地釋出和管理API。

這種一體化架構不僅簡化了資料內建的複雜性,還提高了工作效率和資料品質。使用者不再需要在不同的工具和平台之間切換,而是可以在一個統一的環境中完成所有的資料內建任務。

4、滿足金融級高可用架構優化

在架構上RestCloud提供了更加完善的技術方案,同時也對産品進行了相應的架構調整讓産品可以支援金融級高可用方案、實作了管理、排程和執行節點的分布式部署架構,實作資源在多節點中的動态排程。

通過這種架構,系統能夠在多個節點上平衡負載,提高性能和可用性。管理節點負責整個系統的監控、配置和管理,確定系統的穩定運作。

排程節點負責根據負載情況和資源需求,動态地配置設定任務和資源到可用的執行節點。

執行節點是實際執行計算任務的節點,它們根據排程節點的指令執行任務,并将結果傳回給管理節點。

這種分布式部署架構能夠有效地提高系統的并發處理能力和容錯性,確定系統在高負載和故障情況下依然可靠運作。

三、共建資料內建良性發展生态

全域資料內建平台的發展離不開生态的建構和合作,RestCloud推出了數百個資料內建元件,內建了近百家主流應用系統,為使用者提供了廣泛的選擇和靈活性,使用者隻需簡單下載下傳和安裝這些元件,即可輕松實作與主流業務系統和SaaS的資料打通,資料可在分鐘級内彙入到資料倉庫中。

這一開放生成的政策為使用者提供了更快速、高效的資料內建體驗,加速資料流動和彙聚,實作資料價值的最大化。通過建構完善的生态系統,我們緻力于為使用者提供更廣泛、更便捷的資料內建解決方案,與合作夥伴共同推動資料內建平台的進一步發展。

在資料內建領域中,很多廠商僅僅對開源産品進行簡單的封裝或者制作粗糙的産品,今天,RestCloud推出的“新一代(智能)全域資料內建平台”重新定義了資料內建産品的應用标準。

這标志着RestCloud在資料內建領域又邁出了堅實的一步,該平台可為客戶在數倉建設、資料治理等方面提供更可靠、高效的幫助,實作客戶的數字化戰略,進而讓使用者獲益。

RestCloud未來将繼續開放共享其技術和産品,與合作夥伴一起幫助更多的大中型企業實作數字化戰略。

繼續閱讀