天天看點

一文讀懂雲計算、大資料和AI間的關系和差別

相信大家都聽說過雲計算、大資料和人工智能,并且它們之間好像互相有關系:一般談雲計算的時候會提到大資料、大資料的時候會提人工智能、談人工智能的時候會提雲計算……三者之間相輔相成又不可分割,那麼這三者之間到底是怎麼一回事呢,今天小編就來講講。

一文讀懂雲計算、大資料和AI間的關系和差別

雲計算

1、雲計算最初的目标

雲計算最初的目标是對資源的管理,管理的主要是計算資源、網絡資源、存儲資源三個方面。管理的目标就是要達到空間靈活性和時間靈活性,即我們常說的雲計算的彈性。而解決這個彈性的問題,經曆了漫長時間的發展。

時間靈活性:想什麼時候要就什麼時候要,需要的時候一點就出來了;

空間靈活性:想要多少就有多少。需要一個太很小的電腦,可以滿足;需要一個特别大的空間例如雲盤,雲盤給每個人配置設定的空間動不動就很大很大,随時上傳随時有空間,永遠用不完,也是可以滿足的。

然後人們發明了一個叫做排程(Scheduler)的算法。通俗一點說,就是有一個排程中心,幾千台機器都在一個池子裡面,無論使用者需要多少CPU、記憶體、硬碟的虛拟電腦,排程中心會自動在大池子裡面找一個能夠滿足使用者需求的地方,把虛拟電腦啟動起來做好配置,使用者就直接能用了。這個階段我們稱為池化或者雲化。到了這個階段,才可以稱為雲計算,在這之前都隻能叫虛拟化。

一文讀懂雲計算、大資料和AI間的關系和差別

2、雲計算的私有與公有

雲計算大緻分兩種:一個是私有雲,一個是公有雲。

私有雲:把虛拟化和雲化的這套軟體部署在别人的資料中心裡面。使用私有雲的使用者往往很有錢,自己買地建機房、自己買伺服器,然後讓雲廠商部署在自己這裡。VMware後來除了虛拟化,也推出了雲計算的産品,并且在私有雲市場賺的盆滿缽滿。

公有雲:把虛拟化和雲化軟體部署在雲廠商自己資料中心裡面的,使用者不需要很大的投入,隻要注冊一個賬号,就能在一個網頁上點一下建立一台虛拟電腦。例如AWS即亞馬遜的公有雲;例如國内的阿裡雲、騰訊雲、網易雲等。

一文讀懂雲計算、大資料和AI間的關系和差別

雲計算基本上實作了時間靈活性和空間靈活性;實作了計算、網絡、存儲資源的彈性。計算、網絡、存儲我們常稱為基礎設施Infranstracture, 因而這個階段的彈性稱為資源層面的彈性。管理資源的雲平台,我們稱為基礎設施服務,也就是我們常聽到的IaaS(Infranstracture As A Service)。

一文讀懂雲計算、大資料和AI間的關系和差別

大資料

人工智能是典型的交叉學科,研究的内容集中在機器學習、自然語言處理、計算機視覺、機器人學、自動推理和知識表示等六大方向,目前機器學習的應用範圍還是比較廣泛的,比如自動駕駛、智慧醫療等領域都有廣泛的應用。人工智能的核心在于“思考”和“決策”,如何進行合理的思考和合理的行動是目前人工智能研究的主流方向。

1、大資料擁抱雲計算

大資料裡面的資料,就分三種類型,一種叫結構化的資料,一種叫非結構化的資料,還有一種叫半結構化的資料。

結構化的資料:即有固定格式和有限長度的資料。例如填的表格就是結構化的資料,國籍:中華人民共和國,民族:漢,性别:男,這都叫結構化資料。

非結構化的資料:現在非結構化的資料越來越多,就是不定長、無固定格式的資料,例如網頁,有時候非常長,有時候幾句話就沒了;例如語音,視訊都是非結構化的資料。

半結構化資料:是一些XML或者HTML的格式的,不從事技術的可能不了解,但也沒有關系。

其實資料本身不是有用的,必須要經過一定的處理。例如你每天跑步帶個手環收集的也是資料,網上這麼多網頁也是資料,我們稱為Data。資料本身沒有什麼用處,但資料裡面包含一個很重要的東西,叫做資訊(Information)。

資料十分雜亂,經過梳理和清洗,才能夠稱為資訊。梳理和清洗就需要這幾個步驟:

第一個步驟叫資料的收集。

第二個步驟是資料的傳輸。

第三個步驟是資料的存儲。

第四個步驟是資料的處理和分析。

第五個步驟是對于資料的檢索和挖掘。

一文讀懂雲計算、大資料和AI間的關系和差別

2、大資料時代

當資料量很小時,很少的幾台機器就能解決。慢慢的,當資料量越來越大,最牛的伺服器都解決不了問題時,怎麼辦呢?這時就要聚合多台機器的力量,大家齊心協力一起把這個事搞定,衆人拾柴火焰高。

一個小公司需要大資料平台的時候,不需要采購一千台機器,隻要到公有雲上一點,這一千台機器都出來了,并且上面已經部署好了的大資料平台,隻要把資料放進去算就可以了。

雲計算需要大資料,大資料需要雲計算,二者就這樣結合了。

一文讀懂雲計算、大資料和AI間的關系和差別

AI(人工智能)

1、機器什麼時候才能懂人心

雖說有了大資料,人的欲望卻不能夠滿足。雖說在大資料平台裡面有搜尋引擎這個東西,想要什麼東西一搜就出來了。但也存在這樣的情況:我想要的東西不會搜,表達不出來,搜尋出來的又不是我想要的。

例如音樂軟體推薦了一首歌,這首歌我沒聽過,當然不知道名字,也沒法搜。但是軟體推薦給我,我的确喜歡,這就是搜尋做不到的事情。當人們使用這種應用時,會發現機器知道我想要什麼,而不是說當我想要時,去機器裡面搜尋。這個機器真像我的朋友一樣懂我,這就有點人工智能的意思了。

一文讀懂雲計算、大資料和AI間的關系和差別

2、讓機器學會學習

怎麼才能做到這一點呢?人們就想:我首先要告訴計算機人類的推理的能力。你看人重要的是什麼?人和動物的差別在什麼?就是能推理。要是把我這個推理的能力告訴機器,讓機器根據你的提問,推理出相應的回答,這樣多好?

其實目前人們慢慢地讓機器能夠做到一些推理了,例如證明數學公式。這是一個非常讓人驚喜的一個過程,機器竟然能夠證明數學公式。但慢慢又發現其實這個結果也沒有那麼令人驚喜。因為大家發現了一個問題:數學公式非常嚴謹,推理過程也非常嚴謹,而且數學公式很容易拿機器來進行表達,程式也相對容易表達。

是以,僅僅告訴機器嚴格的推理是不夠的,還要告訴機器一些知識。

于是人們想到:機器是和人完全不一樣的物種,幹脆讓機器自己學習好了。

機器怎麼學習呢?既然機器的統計能力這麼強,基于統計學習,一定能從大量的數字中發現一定的規律。

3、大資料與人工智能

如果我們把人工智能看成一個嗷嗷待哺擁有無限潛力的嬰兒,某一領域專業的海量的深度的資料就是喂養這個天才的奶粉。奶粉的數量決定了嬰兒是否能長大,而奶粉的品質則決定了嬰兒後續的智力發育水準。

人工智能需要大量的資料作為“思考”和“決策”的基礎,另一方面大資料也需要人工智能技術進行資料價值化操作,比如機器學習就是資料分析的常用方式。在大資料價值的兩個主要展現當中,資料應用的主要管道之一就是智能體(人工智能産品),為智能體提供的資料量越大,智能體運作的效果就會越好,因為智能體通常需要大量的資料進行“訓練”和“驗證”,進而保障運作的可靠性和穩定性。

人工智能是程式算法和大資料結合的産物。而雲計算是程式的算法部分,物聯網是收集大資料的根系的一部分。可以簡單的認為:人工智能=雲計算+大資料。

在雲計算與大資料成熟的沃土上誕生的AI可謂是天選之子,随着新科技時代的到來,人們的生活将會更加緊密地與AI技術、大資料和雲計算等新科技粘連在一起,在這種背景下三者的深度融合無疑會使AI與我們的生活之間聯系的更加密切。

本文轉載自51CTO,本文一切觀點和機器智能技術圈子無關。

原文連結 免費體驗百種AI能力以及試用熱門離線SDK:【點此跳轉】

繼續閱讀