本文講的是<b>用中繼資料給大資料排憂解難可行否</b>,在被認為卷入一項謀殺案後,防毒軟體公司McAfee創始人John McAfee飛到在貝裡斯的家中,但他并沒有消失。在接下來的一個月裡,他一邊逃避警察的追捕,一遍通過部落格、社交網站以及媒體的管道出現在公衆的視線裡。
如果不是那張放在一家紐約藝術文化雜志Vice上照片所透露的資訊,這位矽谷傳奇還将繼續與警察玩“捉迷藏”的遊戲。這是個極其細微的資訊,普通人幾乎不會注意到的方面,而在警察和專業人士看來,這微不足道的資訊卻可以分析出John McAfee這張照片的拍攝地點。
Phil Shelley,既是Sears Holdings公司CTO,也是該集團旗下子公司——一家中繼資料供應商公司的CEO,說:“大資料工具最有趣的一點就是它讓你存儲資料變得更容易,會讓你沉迷于存儲資料。但如果你無法使用這些資料或者檢索它們,那麼資料就是無用的”。
Data Governance Institute公司的創始人兼總裁Gwen Thomas也同意大資料正在改變人們對于中繼資料的态度。她表示:“當你談論小資料時,總有一些樣本供你一探虛實,但你在大資料這裡卻沒有這麼多選擇。這就像你從消費水管裡喝水:你将被水流擊倒。”
Shelley認為:中繼資料在商業中被利用在特定情境和地點的資料收集方面,這個嘗試經過了很長時間才被認可,但并不被人時時記得。究其原因,他說:“很多人不願去做記錄中繼資料這個苦差事。人們隻想如何擷取資料,利用資料産生價值。”
傳統意義上,企業都盡量避免讨論中繼資料,因為資料倉庫——比如關系型資料庫就是将資料按照行和列整齊排序的資料庫,“而且中繼資料意味着結構化的資料”,Shelley補充道。新的存儲和分析工具盡管可以用來處理海量的資料和結構,但是采用不同的方法組織資料,都有各自的優勢和劣勢。Shelley承認:“大資料工具的優勢在于當你将資料丢掉一邊時,它不會有強制的規則。它允許你在讀取資料時就應用它們。”
比如,大資料工具Hadoop,就承諾擁有對企業一年資料提供分析的能力。Shelley表示:“但這個缺點則是如果你搞不清資料是什麼或者中繼資料是什麼,那麼你真的不知道接下來怎麼做。”
大資料鴻溝
consultancyEWSolutions總裁David Marco認為,中繼資料不僅給企業提供資料遺産,而且還可以幫助企業建立資料的一緻性。他表示,中繼資料解決了企業定義“消費者”的難題。通常來說,企業不同部門對消費者的定義各不相同,但是通過中繼資料,企業可以制作一個定義或業務政策的規則——或任何重大資料概念,并可廣泛用于其企業範圍的資料分析。他補充道:“當你将分析資訊放入業務發展計劃時,總會出現錯誤或者你丢失了一些資訊。如果你是企業決策者、市場營銷官或者首席資訊官,你難道不想知道那丢失的2%的資料嗎?”中繼資料會讓你的資料更加完整和精确。
Marco認為另一個促使中繼資料崛起的原因便是它可以減少IT支出。當企業建立了多個訂單輸入系統、金融系統而資料完全相同,企業就要花費巨資維持系統營運,這筆費用一場昂貴。他說:“你如何才能擺脫掉這個負擔?你必須知道你需要的資料是什麼,它們意味着什麼,它們都在哪裡——而這就是中繼資料的管理。”
作者: 趙賽坡
來源: IT168
原文标題:用中繼資料給大資料排憂解難可行否?