天天看點

面試官:String長度有限制嗎?是多少?String

面試官:String長度有限制嗎?是多少?String
前言

話說Java中String是有長度限制的,聽到這裡很多人不禁要問,String還有長度限制?是的有,而且在JVM編譯中還有規範,而且有的家人們在面試的時候也遇到了,本人就遇到過面試的時候問這個的,而且在之前開發的中也真實地遇到過這個String長度限制的場景(将某固定檔案轉碼成Base64的形式用字元串存儲,在運作時需要的時候在轉回來,當時檔案比較大),那這個規範限制到底是怎麼樣的,咱們話不多說先䁖䁖去。

String

首先要知道String的長度限制我們就需要知道String是怎麼存儲字元串的,String其實是使用的一個char類型的數組來存儲字元串中的字元的。

面試官:String長度有限制嗎?是多少?String

存儲String的容器原來是它

那麼String既然是數組存儲那數組會有長度的限制嗎?是的有限制,但是是在有先提條件下的,我們看看String中傳回length的方法。

面試官:String長度有限制嗎?是多少?String

String類中的length方法

由此我們看到傳回值類型是int類型,Java中定義數組是可以給數組指定長度的,當然不指定的話預設會根據數組元素來指定:

int[] arr1 = new int[10]; // 定義一個長度為10的數組
int[] arr2 = {1,2,3,4,5}; // 那麼此時數組的長度為5
           

整數在java中是有限制的,我們通過源碼來看看int類型對應的包裝類Integer可以看到,其長度最大限制為2^31 -1,那麼說明了數組的長度是0~2^31-1,那麼計算一下就是(2^31-1 = 2147483647 = 4GB)

面試官:String長度有限制嗎?是多少?String

Integer的取值範圍

看到這我們嘗試通過編碼來驗證一下上述觀點。

面試官:String長度有限制嗎?是多少?String

以字面量形式定義字元串

以上是我通過定義字面量的形式構造的10萬個字元的字元串,編譯之後虛拟機提示報錯,說我們的字元串長度過長,不是說好了可以存21億個嗎?為什麼才10萬個就報錯了呢?

其實這裡涉及到了JVM編譯規範的限制了,其實JVM在編譯時,如果我們将字元串定義成了字面量的形式,編譯時JVM是會将其存放在常量池中,這時候JVM對這個常量池存儲String類型做出了限制,接下來我們先看下手冊是如何說的。

面試官:String長度有限制嗎?是多少?String

java虛拟機規範截圖

常量池中,每個 cp_info 項的格式必須相同,它們都以一個表示 cp_info 類型的單位元組 “tag”項開頭。後面 info[]項的内容 由tag 的類型所決定。

面試官:String長度有限制嗎?是多少?String

java虛拟機規範手冊常量類型表

我們可以看到 String類型的表示是 CONSTANT_String ,我們來看下CONSTANT_String具體是如何定義的。

面試官:String長度有限制嗎?是多少?String

這裡定義的 u2 string_index 表示的是常量池的有效索引,其類型是CONSTANT_Utf8_info 結構體表示的,這裡我們需要注意的是其中定義的length我們看下面這張圖。

面試官:String長度有限制嗎?是多少?String

在class檔案中u2表示的是無符号數占2個位元組機關,我們知道1個位元組占8位,2個位元組就是16位 ,那麼2個位元組能表示的範圍就是2^16- 1 = 65535 。範中class檔案格式對u1、u2的定義的解釋做了一下摘要:

這裡對java虛拟機規摘要部分

1、class檔案中檔案内容類型解釋

定義一組私有資料類型來表示 Class 檔案的内容,它們包括 u1,u2 和 u4,分别代

表了 1、2 和 4 個位元組的無符号數。

每個 Class 檔案都是由 8 位元組為機關的位元組流組成,所有的 16 位、32 位和 64 位長度的數

據将被構造成 2 個、4 個和 8 個 8 位元組機關來表示。

2、程式異常處理的有效範圍解釋

start_pc 和 end_pc 兩項的值表明了異常處理器在 code[]數組中的有效範圍。

start_pc 必須是對目前 code[]數組中某一指令的操作碼的有效索引,end_pc 要

麼是對目前 code[]數組中某一指令的操作碼的有效索引,要麼等于 code_length

的值,即目前 code[]數組的長度。start_pc 的值必須比 end_pc 小。

當程式計數器在範圍[start_pc, end_pc)内時,異常處理器就将生效。即設 x 為

異常句柄的有效範圍内的值,x 滿足:start_pc ≤ x < end_pc。

實際上,end_pc 值本身不屬于異常處理器的有效範圍這點屬于 Java 虛拟機曆史上

的一個設計缺陷:如果 Java 虛拟機中的一個方法的 code 屬性的長度剛好是 65535

個位元組,并且以一個 1 個位元組長度的指令結束,那麼這條指令将不能被異常處理器

所處理。不過編譯器可以通過限制任何方法、執行個體初始化方法或類初始化方法的

code[]數組最大長度為 65534,這樣可以間接彌補這個 BUG。

注意:這裡對個人認為比較重要的點做了标記,首先第一個加粗說白了就是說數組有效範圍就是【0-65565】但是第二個加粗的地方又解釋了,因為虛拟機還需要1個位元組的指令作為結束,是以其實真正的有效範圍是【0-65564】,這裡要注意這裡的範圍僅限編譯時期,如果你是運作時拼接的字元串是可以超出這個範圍的。

接下來我們通過一個小實驗來測試一下我們建構一個長度為65534的字元串,看看是否就能編譯通過。

首先通過一個for循環建構65534長度的字元串,在控制台列印後,我們通過自己度娘的一個線上字元統計工具計算了一下确實是65534個字元,如下:

面試官:String長度有限制嗎?是多少?String
面試官:String長度有限制嗎?是多少?String

然後我們将字元複制後以定義字面量的形式指派給字元串,可以看到我們選擇這些字元右下角顯示的确實是65534,于是乎運作了一波,果然成功了。

面試官:String長度有限制嗎?是多少?String
面試官:String長度有限制嗎?是多少?String

看到這裡我們來總結一下:

問:字元串有長度限制嗎?是多少?

答:首先字元串的内容是由一個字元數組 char[] 來存儲的,由于數組的長度及索引是整數,且String類中傳回字元串長度的方法length() 的傳回值也是int ,是以通過檢視java源碼中的類Integer我們可以看到Integer的最大範圍是2^31 -1,由于數組是從0開始的,是以數組的最大長度可以使【0~2^31-1】通過計算是大概4GB。

但是通過翻閱java虛拟機手冊對class檔案格式的定義以及常量池中對String類型的結構體定義我們可以知道對于索引定義了u2,就是無符号占2個位元組,2個位元組可以表示的最大範圍是2^16 -1 = 65535。

其實是65535,但是由于JVM需要1個位元組表示結束指令,是以這個範圍就為65534了。超出這個範圍在編譯時期是會報錯的,但是運作時拼接或者指派的話範圍是在整形的最大範圍。

解析到這裡就告一段落了,如果覺得在下講得對你有幫助的可以點一波贊或者在看,如果發現有講的不好的或者有什麼遺漏的,歡迎評論區留言互相學習交流。

來自:今日頭條,作者:GoKu程式設計
連結:toutiao.com/i6893014573322863111
-END-
如果看到這裡,說明你喜歡這篇文章,請 轉發、點贊。微信搜尋「web_resource」,關注後回複「進群」或者掃描下方二維碼即可進入無廣告交流群。
↓掃描二維碼進群↓

推薦閱讀 
1.  一份 Spring Boot 項目搭模組化闆
2.  Spring Boot 實作應用監控和報警
3.  Nginx 從入門到實戰
4.  一鍵式搭建分布式檔案伺服器
5.  團隊開發中 Git 最佳實踐

喜歡文章,點個在看