天天看點

Splunk——大資料處理的實時引擎

Splunk——大資料處理的實時引擎

大資料已經成為影響各行各業的熱詞,鑒于中國龐大的使用者基礎,對中國企業而言,大資料的影響也更為深刻。

2013年8月6日,splunk公司在北京舉辦了探讨大資料如何落地的研讨會,分享了大資料給各個領域帶來的變革、大資料技術在中國落地的前沿觀點以及splunk大資料方案的實施案例。

“資料正以幾何的速度在增長,其中最複雜的也最有價值的資料細分市場是機器資料,所有這些像伺服器、安全裝置、傳感器等基礎架構産生的資料都是機器資料,這些機器資料記錄了方方面面的行為。”splunk産品營銷副總裁sanjay mehta說道。splunk所定義的機器資料,包括了檔案或者檔案目錄、syslog、windows事件日志、windows系統資料庫、windows性能名額、unix/linux日志和名額、檔案完整性監視、配置檔案、opsec lea、cisco裝置日志、iis日志、apache日志、websphere日志/名額和其他資料、以及任何其他資料。

對于一些使用者而言,splunk可能顯得有些陌生,談到splunk的業務以及産品定位,sanjay将splunk的軟體比作分析大資料的引擎,他表示:“splunk公司主要處理大資料,對這些大資料進行分析,給我們的客戶、組織帶來價值,而且,我們能保證以低成本的進行實時地分析,允許使用者使用我們的技術對資料進行收集、監控、分析,而且進行可視化。目前,splunk公司的産品和技術已經應用到各行各業,其中包括保險、政府、媒體領域。”

splunk廣泛應用大資料領域

如今,hadoop已經成為熱門的開源架構,也使得很多企業以低成本的方式來存儲自身的資料,但是sanjay表示,要想從hadoop架構上存儲的資料獲得價值是一個具有挑戰性的工作,跟其他軟體相比,hadoop的部署使得成本上降低了,但是需要有更好的服務才能保障,據很多使用者反映,對hadoop部署的服務能力往往跟不上需求的發展,hadoop上的資料太大而無法随意、容易的進行遷移。

sanjay介紹,splunk産品的優勢正是在hadoop存儲資料的基礎上,進行資料的收集、分析和展現,以splunk6月份推出的分析工具hunk為例,因為放在hadoop上的資料,可能是非結構化的,也可能是結構非常随意的資料,hunk是專門處理放在hadoop上的資料的工具,用于探索、分析和可視化hadoop中的資料。

splunk的目的就是讓使用者直接在hadoop上直接分析資料,而且部署的方式簡單,全球的銀行使用者每天有超過20tb的資料放置到splunk中進行處理。

随着資料的量與日俱增,對新産生的資料進行實時分析并與以往的資料進行比較是非常必要的工作。根據使用者的回報,sanjay表示,目前splunk的産品主要應用于五大領域,一是應用于對應用程式進行端到端的管理,了解性能名額;二是日常it運維的管理,比如帶寬和基礎架構的使用情況;三是資訊安全領域,可以收集安全相關的資料,進行分析保證系統安全;四是針對web應用的智能分析,随着各行各業的業務走向線上,重視對使用者行為的分析,是以銷售和業務人員也能從中收集到價值;五是與網際網路相關的領域,以及rfid收集的資料。

不管是全球還是中國,splunk的産品已經被廣泛接受并部署應用,目前已經在90多個國家和地區,使用者達到5600多家。在應用案例方面,sanjay介紹,splunk幫助百事公司在北美使用銷售的手持終端來了解銷售資料的情況,并為線上的saas供應商salesforce提供了完整的平台,此外,metropos、沃達豐都通過splunk大大提高了資料分析的效率。

大資料分析的引擎

splunk的本質是針對機器資料的分析引擎,splunk進階銷售工程師崔玥表示,splunk産品針對所有it系統和基礎設施資料,提供資料搜尋、資料報表和可視化的展現。當然,作為一款軟體,它幾分鐘就可以完成下載下傳和安裝,支援各種主流的作業系統平台。

作為一個完全整合的大資料解決方案,splunk通用的引擎能夠将任何的機器資料廣泛地索引,并支援任何格式的資料,而無需進行格式轉換實時的搜尋引擎,帶來了類似于google的快速搜尋結果;而其自主開發的類似于mapreduce的分布式架構,為系統的可擴充性提供了保證,能夠輕松擴充到支援每天新增上百tb的資料,配合基于角色的資料通路控制,還能夠跨多個資料中心運作。

“總體而言,splunk獨特優勢展現在是通用的資料引擎,支援任意格式定義,具備強大的搜尋和報表語句,軟體安裝後,可以通過浏覽器來登陸,并進行資料來<b>源的定義,選擇資料路徑、資料類型等操作。”崔玥說道。</b>

<b></b>

<b>原文釋出時間為:2013-08-14</b>

<b>本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号</b>