天天看點

再談JavaScript的資料類型問題

 JavaScript的資料類型問題已經讨論過很多次了,但許多人還有許多書仍然沿用着錯誤的、混亂的一些觀點,是以就再細講一回。

提及這個讨論的原因在于argb同學在我的MSN部落格(現在變成了wordproess,在這裡)上的一段回複,又更早的起源則是兩年前關于《JavaScript征途》一書的大讨論:

從“裝B被雷劈講起

——這個事就讓它過去了過去了吧。在讨論中我提及到該書對JavaScript類型系統介紹的混亂,而argb翻出了這篇曆史文章,指我的混亂更混亂。于是我列了以下幾個問題給他:

=============

我想很難很快速地解釋你的問題。那麼,接着你的思路,我就問幾個問題好了:

1、函數是不是類型?是什麼類型?

2、為什麼說JavaScript中的函數是“第一型”的?

3、undefined如何“包裝成object”?即使你所說的是筆誤,那麼對于“一切都是對象”的JavaScript,undefined是什麼?

4、true與Boolean(true)在類型上有什麼不同?

最後強調一下你的用詞問題:Undefined是類型,undefined是值,’undefined’是類型的名稱。此外,應留意JavaScript中存在着值類型與引用類型。

=============

随後argb的回複讓我覺得一切已經混亂到不得不講的地步。因為此前也沒有讨論過《JavaScript征途》中的類型系統問題,于是這幹脆就補個功課。下面認認真真地談談,也順便回複了argb同學。

再次感謝argb。若非如此,我這篇功課還要欠很久。有讀者與朋友們的關心,總是好的。答疑釋解,于人于已,皆成美事。

再談JavaScript的資料類型問題

=============

首先我們談兩點體會。其一,JavaScript不是純粹的面向對象語言,它是混合語言,是以所謂“一切面向對象”既是宣傳用語,也是一種語言處理技巧。僅從“面向對象”來了解這個語言的類型,會犯很多錯誤。其二,ECMAScript的描述總是很準确而又遲滞于這門語言的發展。是以要了解一些現象,既要從JavaScript的曆史中去找,也要考慮到JavaScript現在的發展。ECMAScirpt是一個标準的、規範化的參考,但不是全部。

接下來說說類型。JavaScript既是過程式語言,也是面向對象的語言。這一定程度上,也表現為:它事實上有兩套類型系統。第一套類型系統是用typeof來識别,這是這個語言的基本類型系統,隻有六種類型,即undefined、number、boolean、string、object與function。我一般也稱之為基礎類型系統。之是以稱為“基礎”,是因為第二套類型系統是以它為基礎,從object這一種類型中發展起來的,即對象類型系統。

對象類型系統用instanceof來識别,它相當于其它進階語言中的is操作/運算。面向對象的多态主要通過as和is來表達,對于JavaScript來說,由于是弱類型的(沒有強制類型檢查),是以不需要as。

對象類型系統與基礎類型系統存在映射關系,例如基礎類型的string影射到對象系統中的String。但這隻是影射,是以本質上來說string類型不是String類型。兩者本質上不同。具體來說,undefined,string、number和boolean是“值類型”;object與function是“引用類型”。由于String、Number與Boolean在基礎類型中都屬于object類型,是Object()的子類,是以是引用類型。Function()也是引用類型。所有引用類型都可以看着Object()的子類,是以任意函數也是Object()的子類。例如"<匿名函數> instanceof Object"傳回true。

undefined是值類型,它沒有對應的對象類型——我們通常可以稱之為Undefined類型,但它沒有對應的構造器。undefined隻有一個值,即undefined。準确地說,undefined表明聲明(或産生)了但沒有值的變量。而Null也是一個類型,null是它的惟一值(按照語言規則,null也是一個關鍵字)。Null類型是對象類型,亦即是引用類型。是以Null與Undefined本質的不同,是它們分屬在不同的類型系統中,解釋着不同類型系統中的“無”的概念。一般來說,DOM中的某個屬性或成員如果無值,應該使用null;而JavaScript運算過程中如果出現無值,應該使用undefined。

上面強調要從“兩套類型系統”的角度來了解上述類型。而這兩個類型系統在JavaScript中是可以混用的,實作這一特性的技術被稱為“類包裝”。這是JavaScript對Java的主要借鑒,也是後來的.NET對Java的主要借鑒之一——類包裝也被稱為“裝箱”(以及“拆箱”)。JavaScript中的類包裝過程出現然屬性存取中,即“.運算符”或“[]運算符”。當這兩個運算符發現左操作數x是一個“值類型”資料時,将隐式地調用Object(x)過程将它轉為對象,是以

'abc'.length

這個運算實際上就等效于

Object('abc').length

最後,我們回到原始的問題上來。是以我說:

====

JavaScript 裡面有6種基本類型,對象是其中一種,各種對象是“對象(object)”這一種類型中的子類(類型)。

====

是沒有什麼錯誤的。而朱先生在他的書中說:

====

- JavaScript 語言隻有 3 種最原始的資料類型:數值型、字元串型和布爾型

- JavaScript 還定義了幾個特殊的資料類型,如空類型(null)和未定義類型(undefined)。

- 基本資料類型按值傳送,而複雜資料類型按引用傳送。

====

這幾個觀點都不太靠譜。其一,這三種是原始的資料類型沒錯,但并不是“隻有3種”,這個稍後一點我再說。其二,空類型與未定義類型這兩種說法都是錯的,應該是Null類型和Undefined類型——小寫的,是它們的值;首字母大寫才是它們的類型。其三,undefined也是按值傳遞的,然而在朱先生的分類裡頭,就不知道如何歸屬。他起碼提到了:原始資料類型,特殊資料類型,值(傳遞的)類型,引用(傳遞的)類型。這樣複雜的分類,會更容易讓讀者混淆。

最後說一下“原始的資料類型”。這個用詞在ECMAScript裡面有,稱為"primitive types",但這個概念主要是從“primitive values"裡面引申出來的,而非單獨作為一個類型分類的依據——ECMAScript中隻提到過一次primitive type,并且也沒有稱之為“types”。ECMAScript用“primitive values"來說明一些類型的原始值,例如Boolean  Types具有原始值true/false。但這并沒有說明Boolean對象類型與值類型之間的差異或關系,例如不能表明true與Boolean(true)之間有什麼不同。

ECMAScript中使用“primitive values",并陳述了這些原始值的定義,主要是ECMAScript要兼顧JavaScript語言的實作方案。在ECMAScript中相當大的一部分是在描述一個語言的實作,許多地方需要将一個對象轉換成“primitive values",或使用“primitive values"這樣的名詞來講述它的實際實作——但我必須強調,這與類型系統的定義與規劃沒什麼關系。例如ECMA講述“屬性(property)”這一概念時,原文是:

“Properties are containers that hold other objects, primitive values, or functions. A primitive value is a member of one of the following built-in types: Undefined, Null, Boolean, Number, and String; an object is a member of the remaining built-in type Object; and a function is a callable object. A function that is associated with an object via a property is a method.”

翻譯過來就是:

屬性可以包括其它對象、原始值或函數。一個原始值(primitive value)是以下内建類型的一個成員(即一個值,value):Undefined, Null, Boolean, Number, 以及String;一個對象(object)是其它内建對象類型的一個成員(執行個體,instance),函數(function)是一個可調用的對象。如果一個函數作為一個對象的屬性,則我們稱為方法(method)。

上面的描述與“類型系統如何劃分”有什麼關系嗎?沒有。關鍵在于上列5種原始值,都是可以跨語言來聲明或使用的。然而,要更細節地叙述這一點,需要完整地讨論ECMAScript如何聲明與實作語言的全過程。

是以如果将“primitive value"作為類型系統來讨論,就會相當地令人混亂了。這也是我一開始提出那幾個問題的原因。

最後,強調一點。function是類型。是以你提到:

====

函數不是類型,函數是函數,是類型(type)為object的一個分類(class)

====

大概是所有混亂的總和了。關于第一型(first-class data types)的問題就不再講了,以前已講得太多。大家自己翻吧。

繼續閱讀