天天看點

即使技術再精,面試時一問這個必挂!!

概述

本文我們一起讨論Java類的加載、連結和初始化。Java位元組代碼的表現形式是位元組數組(byte[]),而Java類在JVM中的表現形式是  java.lang.Class類  的對象。一個Java類從位元組代碼到能夠在JVM中被使用,需要經過加載、連結和初始化這三個步驟。這三個步驟中,對開發人員直接可見的是Java類的加 載,通過使用Java類加載器(class  loader)可以在運作時刻動态的加載一個Java類;而連結和初始化則是在使用Java類之前會發生的動作。本文會詳細介紹Java類的加載、連結和 初始化的過程。

Java 類的加載

Java類的加載是由類加載器來完成的。

一般來說,類加載器分成兩類:啟動類加載器(bootstrap)和使用者自定義的類加載器(user-defined)。

兩者的差別在于啟動類加載器是由JVM的原生代碼實作的,而使用者自定義的類加載器都繼承自Java中的  java.lang.ClassLoader類。在使用者自定義類加載器的部分,一般JVM都會提供一些基本實作。應用程式的開發人員也可以根據需要編寫自己的類加載器。JVM中最常使用的是系統類加載器(system),它用來啟動 Java應用程式的加載。通過java.lang.ClassLoader的  getSystemClassLoader()方法可以擷取到該類加載器對象。

類加載器需要完成的最終功能是定義一個Java類,即把Java位元組代碼轉換成JVM中的java.lang.Class類的對象。但是類加載的過程并不是這麼簡單。

Java類加載器有兩個比較重要的特征:層次組織結構和代理模式。

層次組織結構指的是每個類加載器都有一個父類加載器,通過  getParent()方法可以擷取到。類加載器通過這種父親-後代的方式組織在一起,形成樹狀層次結構。代理模式則指的是一個類加載器既可以自己完成Java類的定義工作,也可以代理給其它的類加載器來完成。由于代理模式的存在,啟動一個類的加載過程的類加載器和最終定義這個類的類加載器可能并不是一個。前者稱為初始類加載器,  而後者稱為定義類加載器。

兩者的關聯在于:一個Java類的定義類加載器是該類所導入的其它Java類的初始類加載器。比如類A通過import導入了類  B,那麼由類A的定義類加載器負責啟動類B的加載過程。一般的類加載器在嘗試自己去加載某個Java類之前,會首先代理給其父類加載器。當父類加載器找不到的時候,才會嘗試自己加載。這個邏輯是封裝在java.lang.ClassLoader類的  loadClass()方法中的。一般來說,父類優先的政策就足夠好了。在某些情況下,可能需要采取相反的政策,即先嘗試自己加載,找不到的時候再代理給父類加載器。這種做法在Java的Web容器中比較常見,也是 Servlet規範推薦的做法。比如,Apache Tomcat為每個Web應用都提供一個獨立的類加載器,使用的就是自己優先加載的政策。IBM WebSphere Application Server則允許Web應用選擇。

類加載器使用的政策

類加載器的一個重要用途是在JVM中為相同名稱的Java類建立隔離空間。在JVM中,判斷兩個類是否相同,不僅是根據該類的二進制名稱  ,還需要根據兩個類的定義類加載器。隻有兩者完全一樣,才認為兩個類是相同的。是以,即便是同樣的Java位元組代碼,被兩個不同的類加載器定義之後,所得到的Java類也是不同的。如果試圖在兩個類的對象之間進行指派操作,會抛出  java.lang.ClassCastException。這個特性為同樣名稱的Java類在JVM中共存創造了條件。在實際的應用中,可能會要求同一名稱的Java類的不同版本在JVM中可以同時存在。通過類加載器就可以滿足這種需求。這種技術在 OSGi中得到了廣泛的應用

Java 類的連結

Java類的連結指的是将Java類的二進制代碼合并到JVM的運作狀态之中的過程。在連結之前,這個類必須被成功加載。類的連結包括驗證、準備和解析等幾個步驟。驗證是用來確定Java類的二進制表示在結構上是完全正确的。如果驗證過程出現錯誤的話,會抛出  java.lang.VerifyError錯誤。

準備過程則是建立Java類中的靜态域,并将這些域的值設為預設值。準備過程并不會執行代碼。在一個Java類中會包含對其它類或接口的形式引用,包括它的父類、所實作的接口、方法的形式參數和傳回值的Java類等。解析的過程就是確定這些被引用的類能被正确的找到。解析的過程可能會導緻其它的 Java類被加載。不同的 JVM  實作可能選擇不同的解析政策。

一種做法是在連結的時候,就遞歸的把所有依賴的形式引用都進行解析。而另外的做法則可能是隻在一個形式引用真正需要的時候才進行解析。也就是說如果一個 Java 類隻是被引用了,但是并沒有被真正用到,那麼這個類有可能就不會被解析。考慮下面的代碼:

public class LinkTest {
 public static void main(String[] args) {
  ToBeLinked toBeLinked = null;
  System.out.println("Test link.");
 }
}      

類LinkTest 引用了類 ToBeLinked,但是并沒有真正使用它,隻是聲明了一個變量,并沒有建立該類的執行個體或是通路其中的靜态域。

在  Oracle 的 JDK 6 中,如果把編譯好的 ToBeLinked 的 Java 位元組代碼删除之後,再運作  LinkTest,程式不會抛出錯誤。這是因為 ToBeLinked 類沒有被真正用到,而 Oracle 的 JDK 6  所采用的連結政策使得ToBeLinked 類不會被加載,是以也不會發現 ToBeLinked 的 Java  位元組代碼實際上是不存在的。如果把代碼改成 ToBeLinked toBeLinked = new  ToBeLinked();之後,再按照相同的方法運作,就會抛出異常了。因為這個時候 ToBeLinked 這個類被真正使用到了,會需要加載這個類。

Java 類的初始化

當一個 Java 類第一次被真正使用到的時候,JVM  會進行該類的初始化操作。初始化過程的主要操作是執行靜态代碼塊和初始化靜态域。在一個類被初始化之前,它的直接父類也需要被初始化。但是,一個接口的初始化,不會引起其父接口的初始化。在初始化的時候,會按照源代碼中從上到下的順序依次執行靜态代碼塊和初始化靜态域。考慮下面的代碼:

public class StaticTest {
 public static int X = 10;
 public static void main(String[] args) {
  System.out.println(Y); //輸出60
 }
 static {
  X = 30;
 }
 public static int Y = X * 2;
}      

在上面的代碼中,在初始化的時候,靜态域的初始化和靜态代碼塊的執行會從上到下依次執行。是以變量 X 的值首先初始化成 10,後來又被指派成 30;而變量 Y 的值則被初始化成 60。

Java類和接口的初始化時機

Java 類和接口的初始化隻有在特定的時機才會發生,這些時機包括:

  • 建立一個 Java 類的執行個體。如
MyClass obj = new MyClass()      
  • 調用一個 Java 類中的靜态方法。如
MyClass.sayHello()      
  • 給 Java 類或接口中聲明的靜态域指派。如
MyClass.value = 10      
  • 通路 Java 類或接口中聲明的靜态域,并且該域不是常值變量。如
int value = MyClass.value      
  • 在頂層 Java 類中執行 assert 語句。
assert true;      

通過 Java 反射 API 也可能造成類和接口的初始化。需要注意的是,當通路一個 Java類或接口中的靜态域的時候,隻有真正聲明這個域的類或接口才會被初始化。如下面的代碼所示。

package io.mykit.binghe.test;
 
class B {
 static int value = 100;
 static {
  System.out.println("Class B is initialized."); // 輸出
 }
}
 
class A extends B {
 static {
  System.out.println("Class A is initialized."); // 不會輸出
 }
}
 
public class InitTest {
 public static void main(String[] args) {
  System.out.println(A.value); // 輸出100
 }
}      

在上述代碼中,類 InitTest 通過 A.value 引用了類 B 中聲明的靜态域 value。由于 value是在類 B 中聲明的,隻有類 B 會被初始化,而類 A 則不會被初始化。

建立自己的類加載器

在 Java 應用開發過程中,可能會需要建立應用自己的類加載器。典型的場景包括實作特定的 Java  位元組代碼查找方式、對位元組代碼進行加密/解密以及實作同名 Java 類的隔離等 。建立 自己的 類加載 器并不 是 一件複雜 的事情  ,隻需要繼承自java.lang.ClassLoader 類并覆寫對應的方法即可。java.lang.ClassLoader  中提供的方法有不少,下面介紹幾個建立類加載器時需要考慮的:

  • defineClass():這個方法用來完成從Java位元組代碼的位元組數組到java.lang.Class的轉換。這個方法是不能被覆寫的,一般是用原生代碼來實作的。
  • findLoadedClass():這個方法用來根據名稱查找已經加載過的Java類。一個類加載器不會重複加載同一名稱的類。
  • findClass():這個方法用來根據名稱查找并加載Java類。
  • loadClass():這個方法用來根據名稱加載Java類。
  • resolveClass():這個方法用來連結一個Java類。

這裡比較 容易混淆的是 findClass()方法和 loadClass()方法的作用。前面提到過,在Java 類的連結過程中,會需要對 Java  類進行解析,而解析可能會導緻目前 Java 類所引用的其它 Java 類被加載。在這個時候,JVM 就是通過調用目前類的定義類加載器的  loadClass()方法來加載其它類的。findClass()方法則是應用建立的類加載器的擴充點。應用自己的類加載器應該覆寫  findClass()方法來添加自定義的類加載邏輯。loadClass()方法的預設實作會負責調用  findClass()方法。前面提到,類加載器的代理模式預設使用的是父類優先的政策。這個政策的實作是封裝在  loadClass()方法中的。如果希望修改此政策,就需要覆寫 loadClass()方法。

下面的代碼給出了自定義的類加載的常見實作模式

public class MyClassLoader extends ClassLoader {
 protected Class<?> findClass(String name) throws ClassNotFoundException {
  byte[] b = null; //查找或生成Java類的位元組代碼
  return defineClass(name, b, 0, b.length);
 }
}