一文讀懂雲計算、大資料和AI間的關系和差別

相信大家都聽說過雲計算、大資料和人工智能，并且它們之間好像互相有關系：一般談雲計算的時候會提到大資料、大資料的時候會提人工智能、談人工智能的時候會提雲計算……三者之間相輔相成又不可分割，那麼這三者之間到底是怎麼一回事呢，今天小編就來講講。

雲計算

1、雲計算最初的目标

雲計算最初的目标是對資源的管理，管理的主要是計算資源、網絡資源、存儲資源三個方面。管理的目标就是要達到空間靈活性和時間靈活性，即我們常說的雲計算的彈性。而解決這個彈性的問題，經曆了漫長時間的發展。

時間靈活性：想什麼時候要就什麼時候要，需要的時候一點就出來了；

空間靈活性：想要多少就有多少。需要一個太很小的電腦，可以滿足；需要一個特别大的空間例如雲盤，雲盤給每個人配置設定的空間動不動就很大很大，随時上傳随時有空間，永遠用不完，也是可以滿足的。

然後人們發明了一個叫做排程(Scheduler)的算法。通俗一點說，就是有一個排程中心，幾千台機器都在一個池子裡面，無論使用者需要多少CPU、記憶體、硬碟的虛拟電腦，排程中心會自動在大池子裡面找一個能夠滿足使用者需求的地方，把虛拟電腦啟動起來做好配置，使用者就直接能用了。這個階段我們稱為池化或者雲化。到了這個階段，才可以稱為雲計算，在這之前都隻能叫虛拟化。

2、雲計算的私有與公有

雲計算大緻分兩種：一個是私有雲，一個是公有雲。

私有雲：把虛拟化和雲化的這套軟體部署在别人的資料中心裡面。使用私有雲的使用者往往很有錢，自己買地建機房、自己買伺服器，然後讓雲廠商部署在自己這裡。VMware後來除了虛拟化，也推出了雲計算的産品，并且在私有雲市場賺的盆滿缽滿。

公有雲：把虛拟化和雲化軟體部署在雲廠商自己資料中心裡面的，使用者不需要很大的投入，隻要注冊一個賬号，就能在一個網頁上點一下建立一台虛拟電腦。例如AWS即亞馬遜的公有雲；例如國内的阿裡雲、騰訊雲、網易雲等。

雲計算基本上實作了時間靈活性和空間靈活性；實作了計算、網絡、存儲資源的彈性。計算、網絡、存儲我們常稱為基礎設施Infranstracture, 因而這個階段的彈性稱為資源層面的彈性。管理資源的雲平台，我們稱為基礎設施服務，也就是我們常聽到的IaaS（Infranstracture As A Service）。

大資料

人工智能是典型的交叉學科，研究的内容集中在機器學習、自然語言處理、計算機視覺、機器人學、自動推理和知識表示等六大方向，目前機器學習的應用範圍還是比較廣泛的，比如自動駕駛、智慧醫療等領域都有廣泛的應用。人工智能的核心在于“思考”和“決策”，如何進行合理的思考和合理的行動是目前人工智能研究的主流方向。

1、大資料擁抱雲計算

大資料裡面的資料，就分三種類型，一種叫結構化的資料，一種叫非結構化的資料，還有一種叫半結構化的資料。

結構化的資料：即有固定格式和有限長度的資料。例如填的表格就是結構化的資料，國籍：中華人民共和國，民族：漢，性别：男，這都叫結構化資料。

非結構化的資料：現在非結構化的資料越來越多，就是不定長、無固定格式的資料，例如網頁，有時候非常長，有時候幾句話就沒了；例如語音，視訊都是非結構化的資料。

半結構化資料：是一些XML或者HTML的格式的，不從事技術的可能不了解，但也沒有關系。

其實資料本身不是有用的，必須要經過一定的處理。例如你每天跑步帶個手環收集的也是資料，網上這麼多網頁也是資料，我們稱為Data。資料本身沒有什麼用處，但資料裡面包含一個很重要的東西，叫做資訊（Information）。

資料十分雜亂，經過梳理和清洗，才能夠稱為資訊。梳理和清洗就需要這幾個步驟：

第一個步驟叫資料的收集。

第二個步驟是資料的傳輸。

第三個步驟是資料的存儲。

第四個步驟是資料的處理和分析。

第五個步驟是對于資料的檢索和挖掘。

2、大資料時代

當資料量很小時，很少的幾台機器就能解決。慢慢的，當資料量越來越大，最牛的伺服器都解決不了問題時，怎麼辦呢？這時就要聚合多台機器的力量，大家齊心協力一起把這個事搞定，衆人拾柴火焰高。

一個小公司需要大資料平台的時候，不需要采購一千台機器，隻要到公有雲上一點，這一千台機器都出來了，并且上面已經部署好了的大資料平台，隻要把資料放進去算就可以了。

雲計算需要大資料，大資料需要雲計算，二者就這樣結合了。

AI（人工智能）

1、機器什麼時候才能懂人心

雖說有了大資料，人的欲望卻不能夠滿足。雖說在大資料平台裡面有搜尋引擎這個東西，想要什麼東西一搜就出來了。但也存在這樣的情況：我想要的東西不會搜，表達不出來，搜尋出來的又不是我想要的。

例如音樂軟體推薦了一首歌，這首歌我沒聽過，當然不知道名字，也沒法搜。但是軟體推薦給我，我的确喜歡，這就是搜尋做不到的事情。當人們使用這種應用時，會發現機器知道我想要什麼，而不是說當我想要時，去機器裡面搜尋。這個機器真像我的朋友一樣懂我，這就有點人工智能的意思了。

2、讓機器學會學習

怎麼才能做到這一點呢？人們就想：我首先要告訴計算機人類的推理的能力。你看人重要的是什麼？人和動物的差別在什麼？就是能推理。要是把我這個推理的能力告訴機器，讓機器根據你的提問，推理出相應的回答，這樣多好？

其實目前人們慢慢地讓機器能夠做到一些推理了，例如證明數學公式。這是一個非常讓人驚喜的一個過程，機器竟然能夠證明數學公式。但慢慢又發現其實這個結果也沒有那麼令人驚喜。因為大家發現了一個問題：數學公式非常嚴謹，推理過程也非常嚴謹，而且數學公式很容易拿機器來進行表達，程式也相對容易表達。

是以，僅僅告訴機器嚴格的推理是不夠的，還要告訴機器一些知識。

于是人們想到：機器是和人完全不一樣的物種，幹脆讓機器自己學習好了。

機器怎麼學習呢？既然機器的統計能力這麼強，基于統計學習，一定能從大量的數字中發現一定的規律。

3、大資料與人工智能

如果我們把人工智能看成一個嗷嗷待哺擁有無限潛力的嬰兒，某一領域專業的海量的深度的資料就是喂養這個天才的奶粉。奶粉的數量決定了嬰兒是否能長大，而奶粉的品質則決定了嬰兒後續的智力發育水準。

人工智能需要大量的資料作為“思考”和“決策”的基礎，另一方面大資料也需要人工智能技術進行資料價值化操作，比如機器學習就是資料分析的常用方式。在大資料價值的兩個主要展現當中，資料應用的主要管道之一就是智能體（人工智能産品），為智能體提供的資料量越大，智能體運作的效果就會越好，因為智能體通常需要大量的資料進行“訓練”和“驗證”，進而保障運作的可靠性和穩定性。

人工智能是程式算法和大資料結合的産物。而雲計算是程式的算法部分，物聯網是收集大資料的根系的一部分。可以簡單的認為：人工智能=雲計算+大資料。

在雲計算與大資料成熟的沃土上誕生的AI可謂是天選之子，随着新科技時代的到來，人們的生活将會更加緊密地與AI技術、大資料和雲計算等新科技粘連在一起，在這種背景下三者的深度融合無疑會使AI與我們的生活之間聯系的更加密切。

本文轉載自51CTO，本文一切觀點和機器智能技術圈子無關。

原文連結免費體驗百種AI能力以及試用熱門離線SDK：【點此跳轉】

一文讀懂雲計算、大資料和AI間的關系和差別

繼續閱讀

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

9.spark Core 進階2--Cashe

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

淺談企業活動中進行資料分析的重要性

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

hdu7108哈希