這篇主要說的是程式設計思想發展曆史,分為概述和詳細發展曆史
一,概述
1940年以前:面向機器
最早的程式設計都是采用機器語言來編寫的,直接使用二進制碼來表示機器能夠識别和執行的
指令和數 據。簡單來說,就是直接編寫 0 和 1 的序列來代表程式語言。例如:使用 0000 代表
加載(LOAD),0001 代表 存儲(STORE)等。
機器語言由機器直接執行,速度快,但一個很明顯的缺點就是:寫起來實在是太困難了,一旦你
發現自己 寫錯了,改起來更蛋疼!這樣直接導緻程式編寫效率十分低下,編寫程式花費的時間往往
是實際運作時間 的幾十倍或幾百倍。
有一個關于機器語言和比爾蓋茨的笑話,是說比爾蓋茨拿着繡花針在一張CD光牒上戳,把 Windows
給戳出 來了!但如果真的讓你去戳,不要說 Windows,連一個簡單的“Hello world”都要讓人戳到
眼睛冒煙!
由于機器語言實在是太難編寫了,于是就發展出了彙編語言。彙編語言亦稱符号語言,用助記符
代替機器 指令的操作碼,用位址符号(Symbol)或标号(Label)代替指令或操作數的位址,。彙編語
言由于是采用 了助記符号來編寫程式,比用機器語言的二進制代碼程式設計要友善些,在一定程度上簡
化了程式設計過程。例如 使用 LOAD 來代替 0000,使用 STORE 來代替 0001。
即使彙編語言相比機器語言提升了可讀性,但其本質上還是一種面向機器的語言,編寫同樣困難,
也很容 易出錯。相信很多計算機畢業的學生至今都對學校的彙編課程中的練習程式心有餘悸。
脫離機器第一步:面向過程
面向機器的語言通常情況下被認為是一種“低級語言”,為了解決面向機器的語言存在的問題,
計算機科 學的前輩們又建立了面向過程的語言。面向過程的語言被認為是一種“進階語言”,相
比面向機器的語言 來說,面向過程的語言已經不再關注機器本身的操作指令、存儲等方面,而是
關注如何一步一步的解決具體的問題,即:解決問題的過程,這應該也是面向過程說法的來由。
相比面向機器的思想來說,面向過程是一次思想上的飛躍,将程式員從複雜的機器操作和運作
的細節中解 放出來,轉而關注具體需要解決的問題;面向過程的語言也不再需要和具體的機器綁
定,進而具備了移植 性和通用性;面向過程的語言本身也更加容易編寫和維護。這些因素疊加起
來,大大減輕了程式員的負擔, 提升了程式員的工作效率,進而促進了軟體行業的快速發展。
典型的面向過程的語言有:COBOL、FORTRAN、BASIC、C 語言等。
第一次軟體危機:結構化程式設計
根本原因就是一些面向過程語言中的goto語句導緻的面條式代碼,極大的限制
了程式的規模。結構化程式設計(英語:Structured programming),一種編
程範型。它采用子程式(函數就是一種子程式)、代碼區塊、for循環以及while
循環等結構,來替換傳統的goto。希望借此來改善計算機程式的明晰性、品質以
及開發時間,并且避免寫出面條式代碼。
随着計算機硬體的飛速發展,以及應用複雜度越來越高,軟體規模越來越大,原有
的程式開發方式已經越 來越不能滿足需求了。1960 年代中期開始爆發了第一次軟
件危機,典型表現有軟體品質低下、項目無法 如期完成、項目嚴重超支等,因為軟體
而導緻的重大事故時有發生。例如 1963 年美國 (http://en.wikipedia.org/wiki/Mariner_1)
的水手一号火箭發射失敗事故,就是因為一行 FORTRAN 代碼 錯誤導緻的。
軟體危機最典型的例子莫過于 IBM 的 System/360 的作業系統開發。佛瑞德·布
魯克斯(Frederick P. Brooks, Jr.)作為項目主管,率領 2000 多個程式員夜以繼日的
工作,共計花費了 5000 人一年的工作量,寫出将 近 100 萬行的源碼,總共投入 5 億美
元,是美國的“曼哈頓”原子彈計劃投入的 1/4。盡管投入如此巨大, 但項目進度卻一再延
遲,軟體品質也得不到保障。布魯克斯後來基于這個項目經驗而總結的《人月神話》 一
書,成了史上最暢銷的軟體工程書籍。
為了解決問題,在 1968、1969 年連續召開兩次著名的 NATO 會議,會議正式創造了
“軟體危機”一詞, 并提出了針對性的解決方法“軟體工程”。雖然“軟體工程”提出之後也曾
被視為軟體領域的銀彈,但後 來事實證明,軟體工程同樣無法解決軟體危機。
差不多同一時間,“結構化程式設計”作為另外一種解決軟體危機的方案被提出來了。
Edsger Dijkstra 于 1968 發表了著名的《GOTO 有害論》的論文,引起了長達數年的
論戰,并由此産生了結構化程式設計方 法。同時,第一個結構化的程式語言 Pascal 也在
此時誕生,并迅速流行起來。
結構化程式設計的主要特點是抛棄 goto 語句,采取“自頂向下、逐漸細化、子產品化”的
指導思想。結構 化程式設計本質上還是一種面向過程的設計思想,但通過“自頂向下、逐漸
細化、子產品化”的方法,将軟 件的複雜度控制在一定範圍内,進而從整體上降低了軟體開發
的複雜度。結構化程式方法成為了 1970 年 代軟體開發的潮流。
科學研究證明,人腦存在人類短期記憶一般一次隻能記住 5-9 個事物,這就是著名的
7+- 2 原理。結構化 程式設計是面向過程設計思想的一個改進,使得軟體開發更加符
合人類思維的 7+-2 特點。
第二次軟體危機:面向對象程式設計
結構化程式設計的風靡在一定程度上緩解了軟體危機,然而好景不長,随着硬體的快速發展,
業務需求越來越複雜,以及程式設計應用領域越來越廣泛,第二次軟體危機很快就到來了。
第二次軟體危機的根本原因還是在于軟體生産力遠遠跟不上硬體和業務的發展,相比第
一次軟體危機主要 展現在“複雜性”,第二次軟體危機主要展現在“可擴充性”、“可維護性”
上面。傳統的面向過程(包括 結構化程式設計)方法已經越來越不能适應快速多變的業務
需求了,軟體領域迫切希望找到新的銀彈來解 決軟體危機,在這種背景下,面向對象的思想
開始流行起來。
面向對象的思想并不是在第二次軟體危機後才出現的,早在 1967 年的 Simula 語言
中就開始提出來了,但 第二次軟體危機促進了面向對象的發展。 面向對象真正開始流行是
在 1980s 年代,主要得益于 C++的功 勞,後來的 Java、C#把面向對象推向了新的高峰。
到現在為止,面向對象已經成為了主流的開發思想。
雖然面向對象開始也被當做解決軟體危機的銀彈,但事實證明,和軟體工程一樣,面向對象
也不是銀彈, 而隻是一種新的軟體方法而已。
雖然面向對象并不是解決軟體危機的銀彈,但和面向過程相比,面向對象的思想更加貼近人
類思維的特點, 更加脫離機器思維,是一次軟體設計思想上的飛躍。
二,詳細發展曆史
1940年之前:

圖:霍列瑞斯式的打孔機(pantograph),用于1890年的人口普查。
第一個程式設計語言比現代的計算機還早誕生。首先,這種語言是種編碼(en:code)。
于1801年發明的提花織布機(或稱甲卡提花織布機),運用打孔卡上的坑洞來代表縫紉織布機的手臂動作,以便自動化産生裝飾的圖案。
愛達·勒芙蕾絲在1842年至1843年間花費了九個月,将意大利數學家Luigi Menabrea關于查爾斯·巴貝奇新發表機器分析機的回憶錄翻譯完成。她于那篇文章後面附加了一個用分析機計算伯努利數方法的細節,被部分曆史學家認為是世界上第一個電腦程式。
Herman Hollerith在觀察列車長對乘客票根在特定位置打洞的方式後,意識到他可以把資訊編碼記載到打孔卡上,随後根據這項發現使用打孔卡來編碼并紀錄1890年的人口統計資料。
第一個計算機代碼是針對他們的應用面設計的。在20世紀的前十年主要是用十進制來算數,後來人們發現不隻是用文字,也可以用數字來表現邏輯。
舉例來說,阿隆佐·邱奇曾以公式化(formulaic)的方式表達λ演算。圖靈機是一種
紙帶标記(tape-marking)機器(就像電話公司用的那種)操作方法抽象化後的集合。
圖靈機這種通過有限數字(finite number)呈現機器的方式,奠定了程式如同馮·諾伊
曼結構計算機中的資料一樣地存儲的基礎。但不同于λ演算,圖靈機的代碼并沒有辦
法成為進階程式設計語言的基石,這是是因為它主要的用途是分析算法的複雜度。
就像許多曆史上的"第一次"一樣,第一個現代程式設計語言也很難界定。最一開始是因
為硬體限制而限定了語言,打孔卡允許80行(column)的長度,但某幾行必須用來記
錄卡片的順序。FORTRAN則納入了一些與英文字詞相同的關鍵字,像是"IF"、"GOTO"
(原字詞為go to),以及"CONTINUE"。之後采用磁鼓(magnetic drum)作為存儲器使
用,也代表計算機程式也必須插入(interleave)到磁鼓的轉動(rotation)中。和現今比較
起來,這也讓程式設計語言必須更加依賴硬體(hardware-dependent)。
對部分的人認為必須在"程式設計語言"的狀态确立之前,根據能力(power)以及可讀性
(human-readability)的程度來決定曆史上第一個程式設計語言是什麼語言。提花織布機和
查爾斯·巴貝奇所制作的差分機(en:Difference Engine)都具備在大量限制下,簡單描述
機器應運作行為的語言。也有種并非設計給人類運用的受限特定領域語言
(en:domain-specific language),是将打孔卡運用到自動演奏鋼琴(en:player piano)上。
1940年代:
最早被确認的現代化、電力引導(electrically powered)的計算機約在1940年代被創造出來。程式員在有限的速度及存儲器容量限制之下,撰寫人工調整(hand tuned)過的彙編語言程式。而且很快就發現到使用彙編語言的這種撰寫方式需要花費大量的腦力(intellectual effort)而且很容易出錯(error-prone)。
康拉德·楚澤于1948年發表了他所設計的Plankalkül程式設計語言的論文。但是在他有生之年卻未能将該語言實作,而他原本的貢獻也被其他的發展所孤立。
在這段期間被開發出來的重要語言包括有:
- 1943 - Plankalkül (Konrad Zuse)
- 1943 - ENIAC coding system
- 1949 - C-10
1950與1960年代:
有三個現代程式設計語言于1950年代被設計出來,這三者所派生的語言直到今日仍舊廣泛地被采用:
- Fortran (1955),名稱取自"FORmula TRANslator"(公式翻譯器),由約翰·巴科斯等人所發明;
- LISP,名稱取自"LISt Processor"(枚舉處理器),由約翰·麥卡錫等人所發明;
- COBOL,名稱取自"COmmon Business Oriented Language"(通用商業導向語言),由被葛麗絲·霍普深刻影響的Short Range Committee所發明。
另一個1950年代晚期的裡程碑是由美國與歐洲計算機學者針對"算法的新語言"所組成的委員會出版的ALGOL 60報告(名稱取自"ALGOrithmic Language"(算法語言))。這份報告強化了當時許多關于計算的想法,并提出了兩個語言上的創新功能:
- 嵌套區塊結構:可以将有意義的代碼片段組群成一個區塊(block),而非轉成分散且特定命名的程式。
- 詞彙範圍(lexical scoping):區塊可以有區塊外部無法通過名稱通路,屬于區塊本身的變量、程式以及函數。
另一個創新則是關于語言的描述方式:
- 一種名為巴科斯-諾爾範式 (BNF)的數學化精确符号被用于描述語言的文法。之後的程式設計語言幾乎全部都采用類似BNF的方式來描述程式文法中上下文無關的部分。
Algol 60對之後語言的設計上帶來了特殊的影響,部分的語言很快的就被廣泛采用。後續為了開發Algol的擴充子集合,設計了一個名為Burroughs(en:Burroughs large systems)的大型系統。
延續Algol的關鍵構想所産生的成果就是ALGOL 68:
- 文法跟語義變的更加正交(orthogonal),采用匿名的曆程(routines),采用進階(higher-order)功能的遞歸式輸入(typing)系統等等。
- 整個語言及語義的部分都通過為了描述語言而特别設計的Van Wijngaarden grammar來進行正式的定義,而不僅止于上下文無關的部分。
Algol 68一些較少被使用到的語言功能(如同步與并行區塊)、文法快捷方式的複雜系統,以及類型自動強制轉換(coercions),使得實作者興趣缺缺,也讓Algol 68獲得了很難用(diffcult)的名聲。尼克勞斯·維爾特就幹脆離開該設計委員會,另外再開發出更簡單的Pascal語言。
1951 - Regional Assembly Language
1952 - Autocode
1954 - FORTRAN
1954 - IPL (LISP的先驅)
1955 - FLOW-MATIC (COBOL的先驅)
1957 - COMTRAN (COBOL的先驅)
1958 - LISP
1958 - ALGOL 58
1959 - FACT (COBOL的先驅)
1959 - COBOL
1962 - APL
1962 - Simula
1962 - SNOBOL
1963 - CPL (C的先驅)
1964 - BASIC
1964 - PL/I
1967 - BCPL (C的先驅)
1967-1978:确立了基礎範式
1960年代晚期至1970年代晚期的期間中,程式設計語言的發展也有了重大的成果。大多數現在所使用的主要語言範式都是在這段期間中發明的:
- Simula,于1960年代晚期由奈加特與Dahl以Algol 60超集合的方式發展,同時也是第一個設計支援面向對象進行開發的程式設計語言。
- C,于1969至1973年間由貝爾實驗室的研究人員丹尼斯·裡奇與肯·湯普遜所開發,是一種早期的系統程式設計(en:system programming)語言。
- Smalltalk,于1970年代中期所開發,是一個完全從零開始(ground-up)設計的面向對象程式設計語言。
- Prolog,于1972年由Colmerauer、Roussel,以及Kowalski所設計,是第一個邏輯程式語言。
- ML,于1973年由羅賓·米爾納所發明,是一個基于Lisp所建構的多态(polymorphic)類型系統,同時也是靜态類型函數程式設計語言的先驅。
這些語言都各自演展出自己的家族分支,現今多數現代程式設計語言的祖先都可以追溯他們其中至少一個以上。
在1960年代以及1970年代中結構化程式設計的優點也帶來許多的争議,特别是在程式開發的過程中完全不使用GOTO。這項争議跟語言本身的設計非常有關系:某些語言并沒有包含GOTO,這也強迫程式員必須結構化地編寫程式。盡管這個争議在當時吵翻了天,但幾乎所有的程式員都同意就算語言本身有提供GOTO的功能,在除了少數罕見的情況下去使用GOTO是種不良的程式風格。結果是之後世代的程式設計語言設計者發覺到結構化程式設計語言的争議實在既乏味又令人眼花撩亂。
1968 - Logo
1970 - Pascal
1970 - Forth
1972 - C語言
1972 - Smalltalk
1972 - Prolog
1973 - ML
1975 - Scheme
1978 - SQL (起先隻是一種查詢語言,擴充之後也具備了程式結構)
1980年代:增強、子產品、性能
1980年代的程式設計語言與之前相較顯得更為強大。C++合并了面向對象以及系統程式設計。美國政府标準化一種名為Ada的系統程式設計語言并提供給國防承包商使用。日本以及其他地方運用了大量的資金對采用邏輯程式設計語言結構的第五代語言進行研究。函數程式設計語言社群則把焦點轉移到标準化ML及Lisp身上。這些活動都不是在開發新的範式,而是在将上個世代發明的構想進一步發揚光大。
然而,在語言設計上有個重大的新趨勢,就是研究運用子產品或大型組織化的程式單元來進行大型系統的開發。Modula、Ada,以及ML都在1980年代發展出值得注意的子產品化系統。子產品化系統常拘泥于采用泛型程式設計結構:泛型存在(generics being)、本質(essence),參數化子產品(parameterized modules)。(參閱多态)
盡管沒有出現新的主要程式設計語言範式,許多研究人員仍就擴充之前語言的構想并将它們運用到新的内容上。舉例來說,Argus以及Emerald系統的語言配合面向對象語言運用到分布式系統上。
1980年代的程式設計語言實作情況也有所進展。計算機系統結構中RISC的進展假定硬體應當為編譯器設計,而非身為人類的彙編語言程式員。借由中央處理器速度增快的幫助,編譯技術也越來越積極,RISC的進展對進階語言編譯技術帶來不小的關注。
語言技術持續這些發展并邁入了1990年代。
在這段期間被開發出來的重要語言包括有:
1980 - Ada
1983 - C++ (就像有類别的C)
1984 - Common Lisp
1985 - Eiffel
1986 - Erlang
1987 - Perl
1988 - Tcl
1989 - FL (Backus)
1990年代:網際網路時代
1990年代未見到有什麼重大的創新,大多都是以前構想的重組或變化。這段期間主要在推動的哲學是提升程式員的生産力。許多"快速應用程式開發" (RAD) 語言也應運而生,這些語言大多都有相應的內建開發環境、垃圾回收等機制,且大多是先前語言的派生語言。這類型的語言也大多是面向對象的程式設計語言,包含有Object Pascal、Visual Basic,以及C#。Java則是更加保守的語言,也具備垃圾回收機制。與其他類似語言相比,也受到更多的觀注。新的腳本語言則比RAD語言更新更好。這種語言并非直接從其他語言派生,而且新的文法更加開放地(liberal)與功能契合。雖然腳本語言比RAD語言來的更有生産力,但大多會有因為小程式較為簡單,但是大型程式則難以使用腳本語言撰寫并維護的顧慮。盡管如此,腳本語言還是網絡層面的應用上大放異彩。
1990 - Haskell
1991 - Python
1991 - Visual Basic
1993 - Ruby
1993 - Lua
1994 - CLOS (part of ANSI Common Lisp)
1995 - Java
1995 - Delphi (Object Pascal)
1995 - JavaScript
1995 - PHP
1997 - REBOL
1999 - D
現今的趨勢
程式設計語言持續在學術及企業兩個層面中發展進化,目前的一些趨勢包含有:
- 在語言中增加安全性與可靠性驗證機制:額外的堆棧檢查、資訊流(information flow)控制,以及靜态線程安全。
- 提供子產品化的替代機制:混入(en:mixin)、委派(en:delegates),以及觀點導向。
- 元件導向(component-oriented)軟體開發
- 元程式設計、反射或是通路抽象文法樹(en:Abstract syntax tree)
- 更重視分布式及移動式的應用。
- 與資料庫的內建,包含XML及關系資料庫。
- 支援使用Unicode編寫程式,是以源代碼不會受到ASCII字元集的限制,而可以使用像是非拉丁語系的腳本或延伸标點符号。
- 圖形使用者界面所使用的XML(XUL、XAML)。
2001 - C#
2001 - Visual Basic .NET
2002 - F#
2003 - Scala
2003 - Factor
2006 - Windows PowerShell
2007 - Clojure
2009 - Go
2014 - Swift (程式設計語言)
程式設計語言發展史上的傑出人物
約翰·巴科斯,發明了Fortran。
阿蘭·庫珀,開發了Visual Basic。
艾茲格·迪傑斯特拉,開創了正确運用程式設計語言(proper programming)的架構。
詹姆斯·高斯林,開發了Oak,該語言為Java的先驅。
安德斯·海爾斯伯格,開發了Turbo Pascal、Delphi,以及C#。
葛麗絲·霍普,開發了Flow-Matic,該語言對COBOL造成了影響。
肯尼斯·艾佛森,開發了APL,并與Roger Hui合作開發了J。
比爾·喬伊,發明了vi,BSD Unix的前期作者,以及SunOS的發起人,該作業系統後來改名為Solaris。
艾倫·凱,開創了面向對象程式設計語言,以及Smalltalk的發起人。
Brian Kernighan,與丹尼斯·裡奇合著第一本C程式設計語言的書籍,同時也是AWK與AMPL程式設計語言的共同作者。
約翰·麥卡錫,發明了LISP。
約翰·馮·諾伊曼,作業系統概念的發起者。
丹尼斯·裡奇,發明了C。
比雅尼·斯特勞斯特魯普,開發了C++。
肯·湯普遜,發明了Unix。
尼克勞斯·維爾特,發明了Pascal與Modula。
拉裡·沃爾,創造了Perl與Perl 6。
吉多·範羅蘇姆,創造了Python。
不經一番徹骨寒 怎得梅花撲鼻香