天天看點

《偉大的計算原理》一資訊的表示

本節書摘來華章計算機《偉大的計算原理》一書中的第3章 ,[美]彼得 j. 丹甯(peter j. denning)

克雷格 h. 馬特爾(craig h. martell)著 羅英偉 高良才 張 偉 熊瑞勤 譯 更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

人類在通信時是非常靈活的。這裡有四個例子,其中前兩個例子闡明了什麼是顯式含義:

1)當我們指向某個物體并告訴朋友這個物體的含義時,這個物體就“攜帶”了資訊,因為從現在開始我們的朋友無論何時看到這個物體,這個含義都會在大腦中觸發。

2)當我們發現某些現象模式重複出現時,就會為這樣的重制模式命名。當我們再次看到這樣的模式出現時,便可以預測結果。是以,這個模式就攜帶了可預知結果的資訊。科學的目的就是發現自然界中重制的現象,而工程的目的就是将這些重複的模式轉變為可利用的技術。

接下來的兩個例子說明了什麼是隐式含義:

3)社會群體會定義一些重制方式來交流資訊。例如,很多司機将要進入高速公路時,會一邊緩慢地靠近高速通道一邊開啟方向燈,但并沒有成文的規定要求他們這樣做。

4)人們日常生活中的很多習慣和慣例是沒有命名但攜帶資訊的。例如,在大多數文化中,“過來”的手勢傳遞的就是讓别人靠近你的資訊。

科學家和工程師的工作就是建構技術來處理顯式的資訊,也就是建立資訊的實體表示與預期含義的關聯,如使用電磁信号對人的聲音進行編碼。這樣,我們通過聲明表示與含義之間關聯的方式來産生資訊,然後通過在存儲器中存儲這些表示方式并且用不同的變換規則來處理這些資訊。

千百年來,社會學家和哲學家努力探索隐式的資訊,通常很少有一緻的看法。而工程師對于顯式資訊的處理則要簡單許多。

人工智能試圖跨越顯式資訊和隐式資訊的邊界,工程師正在尋找既能識别隐式資訊又易于人類了解的資訊表示方式。

無論是顯式還是隐式的資訊,這些資訊的存在都建立于人類認知的一緻。我們了解某種表示的含義,因為要麼有人直接告訴我們如何解釋它,要麼我們間接通過經驗學習到。

計算機和通信工程師将資訊編碼成電磁信号進行傳輸。例如麥克風将人的聲音轉變為電信号,然後通過一個磁盤記錄這個信号的副本,最後擴音器将這個磁盤中的信号轉變為聲波。無線發射機将聲音信号疊加在射頻信号中,通過射頻的幅度來表達這個信号,而接收機隻要減去原本的射頻信号就可以提取出聲音信号。工程師對于如何編碼資訊表示方式及其含義必須準确一緻,否則這套實體系統就會出錯。

計算機和通信工程師使用比特(二進制數字)作為資訊的基本機關。香農在20世紀40年代中期引入了“比特”,那時是計算機時代的初期。盡管使用十進制來構造的硬體元件也可以使用,并且早期也有一些計算機使用這些硬體,然而采用二進制元件因更加可靠而逐漸變成行業标準。香農發現二進制計算電路的功能可以用邏輯公式來表示,該公式中隻包含“真”或“假”兩種變量。是以,比特模式可以表示計算機電路。電路處理的數字就是這些二進制數字,也就是電路表示的數字本身(見圖3.2)。自20世紀50年代以來,計算機完全變成了二進制,無論是邏輯電路還是其資料存儲。

《偉大的計算原理》一資訊的表示

圖3.2 兒童使用卡片來快速學習二進制數字。上圖:每張卡片都比其右邊的卡片多一倍的點數。4個兒童列成一排,引導他們通過舉起卡片來表示不同的數字。下圖:當第一個和第四個兒童舉起卡片而第二、三個兒童藏起卡片時,數字9出現了。通過這種方式,兒童很容易掌握二進制。由于任何信号都可以數字化為二進制數字,任何文本檔案也可以被編碼成二進制數字,是以位成為了資訊表示和量化的通用方式(由tim bell和mike ellows提供,csunplugged.org/videos)

香農還證明了實際上大部分通信系統中的連續信号也可以數字化,而數字化引起的一些微不足道的誤差完全可以忽略,稍後将簡要說明。

所有的資料形式,包括數字、信号、邏輯公式、文本等,都可以表示成位模式,位成為衡量資訊量的标準機關。現代詞語中的“24位顔色”“100mb通信”“32位電腦”和“256位密鑰”等都包含位的概念。在20世紀60年代,計算機制造商開始使用“位元組”(即一組8位資訊)來表示ascii擴充碼中的單個字母、數字或标點符号。後來,計算機處理的資料呈指數增長,于是人們開始使用新的希臘文字首來命名這些資料(見表3.1)。其中每一個字首都表示前一項字首的1000倍(或1024倍,210)。在20世紀60年代,磁盤和記憶體容量通常用千位元組來衡量,到了80年代,便用千兆位元組來衡量,而那時的nasa(美國國家航空航天局)卻一直苦惱于如何存儲每日衛星接收到的1tb的資料量。到了2014年,“大資料”用于描述pb級位元組的資料量,同時每年網際網路的資料量都超過了1zb位元組。思科公司(2012)預測網絡規模和資料将持續以指數形式增長。

《偉大的計算原理》一資訊的表示