new String("abc")建立了幾個對象
面試官考察點猜想
這種問題,考察你對JVM的了解程度。涉及到常量池、對象記憶體配置設定等問題。
涉及背景知識詳解
在分析這個問題之前,我們先來了解一下JVM的組成,如圖所示。

在JVM1.8中,記憶體劃分為堆、程式計數器、本地方發棧、方法區(元空間)、虛拟機棧。
JVM知識點普及
下面分别解釋一下JVM運作時記憶體的功能。
堆記憶體空間
堆是 JVM 記憶體中最大的一塊記憶體空間,該記憶體被所有線程共享,幾乎所有對象和數組都被配置設定到了堆記憶體中。堆被劃分為新生代和老年代,新生代又被進一步劃分為 Eden 和 Survivor 區,最後 Survivor 由 From Survivor 和 To Survivor 組成。
但需要注意的是,這些區域的劃分因不同的垃圾收集器而不同。大部分垃圾收集器都是基于分代收集理論設計的,就會采用這種分代模型。而一些新的垃圾收集器不采用分代設計,比如 G1 收集器就是把堆記憶體拆分為多個大小相等的 Region。
方法區
在 jdk8 之前,HotSopt 虛拟機的方法區又被稱為永久代,由于永久代的設計容易導緻記憶體溢出等問題,jdk8 之後就沒有永久代了,取而代之的是元空間(MetaSpace)。元空間并沒有處于堆記憶體上,而是直接占用的本地記憶體,是以元空間的最大大小受本地記憶體限制。
方法區與堆空間類似,是所有線程共享的。方法區主要是用來存放已被虛拟機加載的類型資訊、常量、靜态變量等資料。方法區是一個邏輯分區,包含元空間、運作時常量池、字元串常量池,元空間實體上使用的本地記憶體,運作時常量池和字元串常量池是在堆中開辟的一塊特殊記憶體區域。這樣做的好處之一是可以避免運作時動态生成的常量的複制遷移,可以直接使用堆中的引用。
要注意的是,字元串常量池在JVM中隻有一個,而運作時常量池是和類型資料綁定的,每個Class一個。
- 每個class的位元組碼檔案中都有一個常量池,裡面是編譯後即知的該class會用到的
與字面量
,這就是符号引用
。JVM加載class,會将其類資訊,包括class檔案常量池置于方法區中。class檔案常量池
- class類資訊及其class檔案常量池是位元組碼的二進制流,它代表的是一個類的靜态存儲結構,JVM加載類時,需要将其轉換為方法區中的
類的對象執行個體;同時,會将class檔案常量池中的内容導入java.lang.Class
。運作時常量池
- 運作時常量池中的常量對應的内容隻是字面量,比如一個"字元串",它還不是String對象;當Java程式在運作時執行到這個"字元串"字面量時,會去
裡找該字面量的對象引用是否存在,存在則直接傳回該引用,不存在則在Java堆裡建立該字面量對應的String對象,并将其引用置于字元串常量池中,然後傳回該引用。字元串常量池
- Java的基本資料類型中,除了兩個浮點數類型,其他的基本資料類型都在各自内部實作了常量池,但都在[-128~127]這個範圍内。
虛拟機棧
每當啟動一個新的線程,虛拟機都會在虛拟機棧裡為它配置設定一個線程棧,線程棧與線程同生共死。線程棧以棧幀為機關儲存線程的運作狀态,虛拟機隻會對線程棧執行兩種操作:以棧幀為機關的壓棧或出棧。每個方法在執行的同時都會建立一個棧幀,每個方法從調用開始到結束,就對應着一個棧幀線上程棧中壓棧和出棧的過程。方法可以通過兩種方式結束,一種通過 return 正常傳回,一種通過抛出異常而終止。方法傳回後,虛拟機都會彈出目前棧幀然後釋放掉。
當虛拟機調用一個Java方法時.它從對應類的類型資訊中得到此方法的局部變量區和操作數棧的大小,并據此配置設定棧幀記憶體,然後壓入Java棧中。
棧幀由三部分組成:局部變量區、操作數棧、幀資料區。
1)局部變量區:
- 局部變量區是一個數組結構,主要存放對應方法的參數和局部變量。
- 如果是執行個體方法,局部變量表第一個參數是一個 reference 引用類型,存放的是目前對象本身 this。
2)操作數棧:
- 操作數棧也是一個數組結構,但并不是通過索引來通路的,而是棧的壓棧和出棧操作。
- 操作數棧是虛拟機的工作區,大多數指令都要從這裡彈出資料、執行運算、然後把結果壓回操作數棧。
3)動态連結:
- 每個棧幀内部都包含一個指向目前方法所在類型的運作時常量池的引用,以便對目前方法的代碼實作動态連結。
- 在class檔案裡面,一個方法若要調用其他方法,或者通路成員變量,則需要通過符号引用來表示,動态連結的作用就是将這些以符号引用所表示的方法轉換為對實際方法的直接引用。
4)方法傳回:
- 方法執行後,有兩種方式退出該方法:正常調用完成,執行傳回指令。異常調用完成,遇到未捕獲異常,不會有方法傳回值給調用者。
本地方法棧
本地方法棧與虛拟機棧所發揮的作用是相似的,當線程調用Java方法時,會建立一個棧幀并壓入虛拟機棧;而調用本地方法時,虛拟機會保持棧不變,不會壓入新的棧幀,虛拟機隻是簡單的動态連結并直接調用指定的本地方法,使用的是某種本地方法棧。比如某個虛拟機實作的本地方法接口是使用C連接配接模型,那麼它的本地方法棧就是C棧。
本地方法可以通過本地方法接口來通路虛拟機的運作時資料區,它可以做任何他想做的事情,本地方法不受虛拟機控制。
程式計數器
每一個運作的線程都會有它的程式計數器(PC寄存器),與線程的生命周期一樣。執行某個方法時,PC寄存器的内容總是下一條将被執行的位址,這個位址可以是一個本地指針,也可以是在方法位元組碼中相對于該方法起始指令的偏移量。如果該線程正在執行一個本地方法,那麼此時PC寄存器的值是 undefined。
程式計數器是程式控制流的訓示器,分支、循環、跳轉、異常處理、線程恢複等基礎功能都需要依賴這個計數器來完成。多線程環境下,為了線程切換後能恢複到正确的執行位置,每條線程都需要有一個獨立的程式計數器,各條線程之間計數器互不影響,獨立存儲。
代碼在JVM記憶體中的展現
當我們通過
Object o=new Object()
建立一個對象時,在JVM中會配置設定一塊記憶體用來存儲該對象的資訊,實作原理如下圖所示。
在main方法中,建立了一個局部變量
o
,當main方法運作時,首先會把main方法壓入到棧幀中,接着執行該方法的
Object o =new Object()
建立對象。
- 在局部變量表中建立一個局部變量
o
- 在堆記憶體中配置設定一塊記憶體位址,用來存儲
對象。object
- 變量
指向堆記憶體中的記憶體位址。o
我們再來看一個例子,聲明一個Person對象,在該對象中存在一個常量
name
、以及一個成員變量
age
,當運作該類中的
main
方法時,此時JVM記憶體中的運作情況如下。
在這個例子中,看到了常量池的出現,看來,還有必要了解一下常量池的知識
JVM中的常量池
在JVM中,常量池主要分為:Class檔案常量池、運作時常量池,當然還有全局字元串常量池,以及基本類型包裝類對象常量池。
常量池主要存放兩大類常量:字面量和符号引用。
- 字面量:字面量主要是文本字元串、final 常量值、類名和方法名的常量等。
- 符号引用:符号引用對java動态連接配接起着非常重要的作用。主要的符号引用有:類和接口的全限定名、字段的名稱和描述符、方法的名稱和描述符等。
Class檔案常量池
class檔案是一組以8位位元組為機關的二進制資料流,在java代碼的編譯期間,我們編寫的.java檔案就被編譯為.class檔案格式的二進制資料存放在磁盤中,其中就包括class檔案常量池。
為了更好的說明,我們通過下面這段代碼為例進行講解。
class ConstantExample{
private int value = 1;
public String s = "abc";
public final static int f = 0x101;
public void setValue(int v){
final int temp = 3;
this.value = temp + v;
}
public int getValue(){
return value;
}
}
這段代碼被編譯後,通過
javap -v
指令檢視編譯後的位元組碼。
從下面這個位元組碼資訊中可以看到,執行這個指令之後我們得到了該class檔案的版本号、常量池、已經編譯後的位元組碼指令(處于篇幅原因這裡省略),下面我們會對照這個class檔案來講解:
example/target/classes/HelloExample.class
Last modified 2021-10-25; size 734 bytes
MD5 checksum fd06c1426f4fdef12aa109ee7f010a45
Compiled from "HelloExample.java"
public class HelloExample
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #6.#32 // java/lang/Object."<init>":()V
#2 = Fieldref #5.#33 // HelloExample.value:I
#3 = String #34 // abc
#4 = Fieldref #5.#35 // HelloExample.s:Ljava/lang/String;
#5 = Class #36 // HelloExample
#6 = Class #37 // java/lang/Object
#7 = Utf8 value
#8 = Utf8 I
#9 = Utf8 s
#10 = Utf8 Ljava/lang/String;
#11 = Utf8 f
#12 = Utf8 ConstantValue
#13 = Integer 257
#14 = Utf8 <init>
#15 = Utf8 ()V
#16 = Utf8 Code
#17 = Utf8 LineNumberTable
#18 = Utf8 LocalVariableTable
#19 = Utf8 this
#20 = Utf8 LHelloExample;
#21 = Utf8 getValue
#22 = Utf8 ()I
#23 = Utf8 setValue
#24 = Utf8 (I)V
#25 = Utf8 MethodParameters
#26 = Utf8 main
#27 = Utf8 ([Ljava/lang/String;)V
#28 = Utf8 args
#29 = Utf8 [Ljava/lang/String;
#30 = Utf8 SourceFile
#31 = Utf8 HelloExample.java
#32 = NameAndType #14:#15 // "<init>":()V
#33 = NameAndType #7:#8 // value:I
#34 = Utf8 abc
#35 = NameAndType #9:#10 // s:Ljava/lang/String;
#36 = Utf8 HelloExample
#37 = Utf8 java/lang/Object
字面量
字面量接近于java語言層面的常量概念,主要包括:
- 文本字元串,也就是我們經常聲明的:
中的public String s = "abc";
"abc"
#3 = String #34 // abc
- 用final修飾的成員變量,包括靜态變量、執行個體變量和局部變量
#11 = Utf8 f #12 = Utf8 ConstantValue #13 = Integer 257
這裡需要說明的一點,上面說的存在于常量池的字面量,指的是資料的值,也就是
abc
和
0x101(257)
,通過上面對常量池的觀察可知這兩個字面量是确實存在于常量池的。
而對于基本類型資料(甚至是方法中的局部變量),也就是上面的
private int value = 1
;常量池中隻保留了他的的字段描述符
I
和字段的名稱
value
,他們的字面量不會存在于常量池:
符号引用
符号引用主要設涉及編譯原理方面的概念,包括下面三類常量:
- 類和接口的全限定名,也就是
這樣,将類名中原來的"."替換為"/"得到的,主要用于在運作時解析得到類的直接引用.Ljava/lang/String;
#5 = Class #36 // HelloExample #6 = Class #37 // java/lang/Object
- 字段的名稱和描述符,字段也就是類或者接口中聲明的變量,包括類級别變量(static)和執行個體級的變量
#2 = Fieldref #5.#33 // HelloExample.value:I #7 = Utf8 value #8 = Utf8 I
運作時常量
運作時常量池是方法區的一部分,是以也是全局共享的。我們知道,jvm在執行某個類的時候,必須經過加載、連接配接(驗證,準備,解析)、初始化,在第一步的加載階段,虛拟機需要完成下面3件事情:
- 通過一個類的“全限定名”來擷取此類的二進制位元組流
- 将這個位元組流所代表的靜态儲存結構轉化為方法區的運作時資料結構
- 在記憶體中生成一個類代表這類的java.lang.Class對象,作為方法區這個類的各種資料通路的入口
這裡需要說明的一點是,類對象和普通的執行個體對象是不同的,類對象是在類加載的時候生成的,普通的執行個體對象一般是在調用new之後建立。
上面第二條,将class位元組流代表的靜态儲存結構轉化為方法區的運作時資料結構,其中就包含了class檔案常量池進入運作時常量池的過程。這裡需要強調一下,不同的類共用一個運作時常量池,同時在進入運作時常量池的過程中,多個class檔案中常量池中相同的字元串隻會存在一份在運作時常量池中,這也是一種優化。
運作時常量池的作用是存儲 Java class檔案常量池中的符号資訊。運作時常量池 中儲存着一些 class 檔案中描述的符号引用,同時在類加載的“解析階段”還會将這些符号引用所翻譯出來的直接引用(直接指向執行個體對象的指針)存儲在 運作時常量池 中。
運作時常量池相對于 class 常量池一大特征就是其具有動态性,Java 規範并不要求常量隻能在運作時才産生,也就是說運作時常量池中的内容并不全部來自 class 常量池,class 常量池并非運作時常量池的唯一資料輸入口;在運作時可以通過代碼生成常量并将其放入運作時常量池中,這種特性被用的較多的是String.intern()(這個方法下面将會詳細講)。
問題解答
了解了上述JVM的背景知識之後,再回到最開始的問題.下面這段代碼會建立幾個對象?
String str=new String("abc");
- 首先,我們看到這個代碼中有一個
關鍵字,我們知道new指令是建立一個類的執行個體對象并完成加載初始化的,是以這個字元串對象是在運作期才能确定的,建立的字元串對象是在堆記憶體上。new
- 其次,在String的構造方法中傳遞了一個字元串
,由于這裡的abc
是被abc
修飾的屬性,是以它是一個字元串常量。在首次建構這個對象時,JVM拿字面量final
去字元串常量池試圖擷取其對應String對象的引用。于是在堆中建立了一個"abc"
的String對象,并将其引用儲存到字元串常量池中,然後傳回;"abc"
是以,這裡正确的回答應該是: 如果
abc
這個字元串常量不存在,則建立兩個對象,分别是
abc
這個字元串常量,以及
new String
這個執行個體對象。
如果
abc
這字元串常量存在,則隻會建立一個對象。
問題總結
關于這道題,其實涉及到的知識點非常多,我并沒有非常完整的把JVM的内容整體說完,因為JVM整個體系還是較為龐大的。
是以,建議大家平時如果有時間的情況下,可以系統化的學習一下JVM有關的内容,這塊的面試問題還是比較多的。
關注[跟着Mic學架構]公衆号,擷取更多精品原創