天天看點

智能大資料整合的價值

在過去的幾年裡,人們從知道大資料的概念,發展到一些組織能夠真正實施一些大資料項目。然而,在一些組織的資料中心團隊負責實施這些業務驅動的舉措之後,現在才開始認識到實作真正大資料內建的複雜性和深度。

大資料通過人們生活,工作平台,應用程式,以及裝置提供了多種格式的大量的資料。大量的結構化和非結構化的内容往往使使用者非常難以通路和分析所需的資訊。

智能大資料整合的價值

現代資料中心往往是一個複雜的系統,互相連接配接的伺服器和裝置存儲,處理和分發各種來源的大量資訊。但智能大資料整合,在改造傳統的資訊系統,可以緩解從地理位置分散的網站,甚至其他資料中心的聚集和分析資訊的鬥争。

現代資料中心趨向于儲存,處理互聯伺服器和裝置的一個複雜的系統,以及大量的資訊分發和從各種來源。但聰明的大資料整合,重塑傳統it系統,可以緩解彙總和分析來自地理上分散的地點,甚至其他的資料中心資訊的鬥争。

如果一個資料中心是一個組織的大腦,那麼可以認為其資料源就是回報給神經和細胞的資訊。智能大資料內建意味着該組織的“神經系統”,為整個企業快速傳達資訊,為現代商業生态系統起着至關重要的作用。但這也意味着資料中心的管理人員将獲得他們尋求的準确和高效的資料處理的安全性,品質,控制和管理。

從哪裡開始

任何大資料項目的目的是為了獲得更好的結果,其中包括直接進行實時洞察和基于循環模式的長期觀點,但首先你必須克服早期的內建挑戰。是以要問你自己:

· 你所有的關鍵資料來自哪裡?

· 你的組織如何聚合并快速移動所有的資料?

· 如何分析可用的資料是否有價值?

· 通過在技術和基礎設施方面的投資,你的企業如何才能最大限度地發揮價值?

最終,大資料整合攝入,準備和提供的資料,不管是什麼來源。這包括利用在企業每一類型的資料,包括複雜的,往往是非結構化的機器産生的資料,這通常需要一個更加融合的資料中心的基礎設施。

是以,第一步驟,可以說是最重要的一步,是整合所有可用的資料。以下是确定你的大資料內建項目有效實施的三個關鍵領域。

(1)可靠的資料流

攝入大資料到一個平台,像apachehadoop這樣的平台是不夠智能的,不足以啟動一個hadoop叢集,輸入所有類型的資料,并得出具有突破性的新見解,展現自己。大資料行業廠商似乎每一個星期都在釋出新的工具和更新版本,甚至将某一技術引入到你的堆棧,雖然功能并不強大,但卻可以使你的整個平台過時。

這是常見的企業應用程式和hadoop叢集之間的經驗資料流和資料退化問題。是以,大多數反應涉及手工編碼正在嘗試努力工作,并抛棄一些其他類型的技術。通常情況下,這是一個解決方案。但這不是最終的解決辦法。

采用一個安全的,靈活的內建平台,專注于調動實際的資料流進出資料中心的管道,確定在越來越複雜的工作場所的生态系統進行可靠的資訊交換。

(2)可擴充性

目前存在一些主要的整合,治理和安全問題,需要針對不同層次的大資料采取不同的舉措,特别是在資料中心。我們今天正在經營業務在其規模和資訊方面日益龐大,這使得資料成為“大資料”。而人們需要跨越地域和傳統的資料中心來管理大資料,那些過時陳舊的工具已經嚴重低估了現代需求。

随着企業的發展和新的資料源開始發揮作用,需要增加不同的技術,你的系統将無一例外地必須适應。如果你将現在的問題通過手工編碼解決,當你試圖擴充之後,會不會在擁有它以後抛棄它?

簡單地增加更多的從業人員或代碼的問題并不是一個可擴充的政策,也不會解決複雜的大資料傳輸問題。需要有一個堅實的資料內建和管理平台下的商業智能工具,可以輕松地擴充,采用衆多的大資料工具,并且其來源而不中斷。

(3)資料品質,分類,治理

而從結構化資料出來的crm和erp應用程式通常很好地進行企業的分析,但它是非結構化的資料,更加難以管理。企業必須以某種方式治理資訊混亂,因為即使是最小的資料品質的問題也會産生巨大的錯誤。成功的公司在中繼資料級别上做到這一點。

通過中繼資料定義資訊是至關重要的,因為它提供了來自大資料的結構,幫助進行分類和整理這些資訊以後可以輕松找到。當資訊流動到你的資料湖,必須進行某種分類,是以你正在做分析的資料實際上是準确的。

企業在錯誤的資料方面浪費了一些技術周期,特别是昂貴的今天。所有這些品質和分類必須在某一點上進行,但它應該在早期的水準,即使在內建周期。企業認為在資料品質的早期可以得到更好的,更有價值的分析。

總結:

每一個組織都會成為一個資料組織,或是被甩在後面。是什麼使一個公司可以獨有他們的資料,并更好地使用資料。是以,一個成功的大資料項目最終取決于一個組織的捉捕其資料的能力。

快速攝入和處理的大資料,需要一個可靠的內建基礎設施,可以很容易地擴充以容納大量的資料量,驅動實時通路,并支援每一個請求分析。利用資訊,以獲得競争優勢,這聽起來很偉大,但隻有可靠準确地內建了所有的資料源之後,才能建立一個可用的資料湖。

當正确的資訊傳遞給正确的人,是以可以了解并采取行動最大限度地提高你的大資料整合的價值。但是,隻有當企業支援提供了大資料下的投資和可靠的內建平台,他們将獲得每個企業都在尋求大資料的最佳回報。

====================================分割線================================

本文轉自d1net(轉載)

繼續閱讀