天天看點

《偉大的計算原理》一資訊的轉換

本節書摘來華章計算機《偉大的計算原理》一書中的第3章 ,[美]彼得 j. 丹甯(peter j. denning)

克雷格 h. 馬特爾(craig h. martell)著 羅英偉 高良才 張 偉 熊瑞勤 譯 更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

一個單純的通信系統隻是簡單地将資訊從一處傳輸到另一處,但是計算機會做更多的工作,即轉換資訊。轉換就帶來了更多可能,其中最顯著的産品就是新資訊的出現。簡單的轉換包括将一個數平方、計算π至指定小數位數、對一列數字按照升序排列,每一次轉換都是将一種資訊模式作為輸入,并建立一種資訊模式作為輸出。

因為二進制模式可以被解析為數,是以一次轉換在數學上看來就像是一個輸入數到輸出數的映射函數。能夠被機器計算的函數被稱為可計算函數。圖靈和他同時代的人們用這個概念來定義計算。圖靈表示一個簡單的抽象計算機——圖靈機,足以實作任何可計算的函數(turing 1937)。圖靈機遵循一個非常簡單的指令程式來實作這些轉換。因為每一條指令顯然可以被機器實作,那麼計算機轉換二進制的時候并不考慮它們的含義。這類似于香農所強調的,信道可以被設計得完全可靠并且不考慮傳輸資訊的含義。

當我們稍微深入了解機器如何轉換輸入時,就會發現程式設計的一個重要方面,稱之為含義保留(meaning-preserving)。設想兩個數a和b相加,兩個數相加意味着什麼呢?這意味着我們要遵循一系列加法算法的步驟。這個步驟包括連續對a和b的兩個對應的數字位相加,然後将其進位結果傳遞到更高位。我們對于屬于{0,1,2,…,9}中的數字對有明确的加法規則,并且會産生進位0或者1。當為這個算法設計程式時,我們需要注意讓每條指令都能夠産生正确的加法結果。如果成功了,我們可以相信機器能夠正确做出兩個數的加法。若失敗了,我們會說機器壞了。

換句話說,設計過程本身就是将我們腦中的加法過程轉換為機器執行加法的指令模式,加法的含義就存在于機器和其算法的設計之中。

這對于任何其他的可計算函數也是适用的。我們把大腦中想法的具體含義轉換成可計算的函數,将它輸出到程式中,進而控制機器實作這個想法。這個過程也就是将具有我們想法含義的函數轉變為對機器的設計。

從這個角度看,機器和通信系統不考慮二進制資料含義進行資訊處理的概念有些站不住腳。算法和機器被工程師和程式員植入了含義,我們設計機器進而使得每個計算步驟和輸出都是我們想要的含義,假設輸入也具有我們想要的含義。仔細精确的設計就是為了不用擔心機器曲解我們想要表達的含義。

計算機将計算函數和信道結合,一個信道将輸入送到執行計算函數的機器,另一個信道将輸出送到目的地。這種情況下信道和計算機似乎隻完成了運輸和操作資訊位的工作。然而從人類的角度來看,計算帶來了新的資訊,無論計算機輸出比輸入更多還是更少的資訊。例如,前文提到的一個計算π的函數,在輸入一個三位數“900”時能生成900位的π的值,輸出擴充了300倍的資訊量。一個排序函數的輸出和輸入具有同樣的位數,但是具有不同的順序。一個平均函數能夠計算出少量的數字來代表大量資料的平均值。

數字表示和機器操作都依賴于實體過程,每個機器操作都需要花費少量的時間和功耗。有些我們希望計算的函數需要花費太多的步驟以至于在有生之年無法等到機器傳回結果。計算所需的實體處理嚴重限制了我們能夠計算的内容。

計算的邏輯也會帶來限制,其中最有名的就是我們想計算但無法計算的函數。圖靈在1936年提到了停機問題——不存在一個程式,可以檢查任何程式并且判斷其在給定輸入上是否包含無限循環。一個現在的執行個體是惡意軟體檢測,即不存在一個程式能夠檢測任意給定程式是否嵌入了惡意軟體檢測程式。我們在第6章檢驗計算的實體和邏輯局限性的時候,還會再回到這個話題。

即使當我們将注意力限制在可以計算并且很快傳回有用結果的函數,也可以發現一些有趣的問題。當一個函數在計算我們沒有見過的資料位時,這些資料位是新的資訊嗎(見圖3.6)?或者它們隻是現有資訊的結果?dna包含資訊嗎?很多生物學家認為包含。若dna是一種資訊,那它的資訊源和接收端又是什麼呢?如果對dna解碼,我們能得到什麼資訊呢?解碼的dna可以用來尋找治愈遺傳疾病的治療方案,也可以識别犯罪現場的行為人。将dna與資料庫比對僅僅揭示了現有的資訊還是生成了新的資訊呢?經典的資訊論無法回答這樣的問題。

《偉大的計算原理》一資訊的轉換

圖3.6 哈勃太空望遠鏡的集光傳感器陣列編碼tb級資料并傳輸到地球,這些資料再被處理成為圖像。計算理論将這個圖像處理過程描述為方程y = f(x),其中輸入資料x在函數計算後産生輸出圖像y。這個機器實作的功能(将信号發給它,它又生成信号)不依賴于望遠鏡傳輸的資訊的含義,然而人類看到y輸出的是一張美麗的圖檔——船底座星雲的實際展示(圖檔來源:nasa)

繼續閱讀