天天看點

亞馬遜CTO:大資料也會帶來大問題

亞馬遜cto維爾納•沃格爾(werner vogels)表示,大資料能夠在方方面面改善我們的生活,帶來大美好,但也會導緻一些大問題。

機器們在開始接管一切,物聯網的未來已經到來。在令人眼花缭亂的各種應用程式當中,機器在源源不斷地産生資料,其中大部分推送到雲端進行存儲、處理和分析。然而,正如亞馬遜首席技術官沃格爾向mongodb world大會與會者所說的,我們正在産生的“大資料”所帶來的結果并不全都是我們喜聞樂見的。

大資料?了不起

當下的資料之是以很大,并不是因為它存在于俨然龐然大物的大型主機或者巨大的集中式資料庫上,也不是因為每一家大公司都在創造大資料,而是因為我們居住于一個全新的機器時代,一個無處不在的機器産生空前海量且豐富多樣的資料的機器時代。

它的規模究竟有多大呢?大資料統計恐怕難以給人留下深刻印象,但沃格爾還是試圖這麼做。他分享的兩項資料統計确實令人驚歎,因為它們很好地說明了物聯網資料有多麼地失控:

嬰兒出生第一天産生的資訊量相當于美國國會圖書館資訊藏有量的70倍,這不僅僅是因為醫院裝置捕捉的資料,還因為自豪的家長的錄像、拍照等行為;

監控攝像頭創業公司dropcam(剛被谷歌旗下的nest公司以6000萬美元買下)每分鐘的資料上傳量要超過youtube,每月的資料處理量達到千萬億位元組(pb)。它的攝像頭包括嬰兒螢幕和家居安全系統。

随着企業機構紛紛學會利用所産生的資料,業内出現了一些極為有用的用途。例如,零售店通過資料分析來最大限度地降低顧客流失率,以及更加友善顧客找到他們想要購買的産品或者想要的優惠商品。其它用途的商業價值較低,隻是讓人覺得新奇而已。

體育的悲觀科學

不過,沃格爾指出,其它的用途可能會幹擾到我們的生活的自然演進,表面上它們似乎讓事情變得更好,但實際上并非如此。競技體育就是很好的例子。

正如我們欣賞勒布朗•詹姆斯勢如破竹的得分能力,路易斯•蘇亞雷斯在綠茵場上不可阻擋的破門能力那樣,體育很大一部分的樂趣是來自于觀賞運動員憑自己的直覺去發揮。

當然,物聯網資料是能夠幫助強化運動員的那種直覺。例如,科學家們發現,球員在一塊打得很好很流暢的時候,他們的心跳節律是一緻的。教練能夠根據隊員的心跳情況而非場上表現來判斷哪位隊員跟其他隊友不合拍。

或許這種用途并無不妥。但假如在比賽最後的決勝時刻,是由資料科學家而非場上的領袖球員(如詹姆斯)來決定怎麼完成最後一投(如要在距離籃筐多少英尺的位置投,接球就投還是急停跳投,最好要創造出多少投籃空間,跟防守者要相隔多遠)呢?

沃格爾指出,“有了聯網資料,意味着最後一擊不是你根據敵情來伺機而動完成的。你是根據資料科學家的訓示去執行最後一投的。”最終你或許通過這樣赢得了比賽,但這可能也剝奪了比賽的某種純粹而重要的東西。将體育比賽變成一項科學,恐怕會扼殺其中的樂趣。

也許它是美好的——也許

盡管大資料可能會被不當利用——不管是為了不法企圖,是隻是為了可能會扼殺生活趣味的目的——但沃格爾還是為物聯網資料目前的廣泛利用感到高興。我們往往老想着讓冰箱提醒我們喝多點牛奶,但實際上,我們有很多有力得多的原因去使用物聯網資料:dna測序、節能、太空探索等等。

我們應當記住大資料并不總能帶來美好,不應該盲目沖進大資料這一美麗新世界。有的時候,恰恰就是混亂無章造就了生活的美好。

原文釋出時間為:2014-06-29

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀