我們先要記住三者的特征:
- String 字符串常量
- StringBuffer 字符串變量(線程安全)
- StringBuilder 字符串變量(非線程安全)
一、定義
查看API會發現,String、StringBuffer、StringBuilder都實現了 CharSequence接口,雖然它們都與字符串相關,但是其處理機制不同。
- String:是不可改變的量,也就是創建后就不能在修改了。
- StringBuffer:是一個可變字符串序列,它與String一樣,在內存中保存的都是一個有序的字符串序列(char類型的數組),不同點是StringBuffer對象的值都是可變的。
- StringBuilder:與StringBuffer類基本相同,都是可變字符換字符串序列,不同點是StringBuffer是線程安全的,StringBuilder是線程不安全的。 在性能方面,由于String類的操作是產生新的String對象,而StringBuilder和StringBuffer只是一個字符數組的擴容而已,所以String類的操作要遠慢于StringBuffer和StringBuilder。
二、使用場景
使用String類的場景:在字符串不經常變化的場景中可以使用String類,例如常量的聲明、少量的變量運算。
使用StringBuffer類的場景:在頻繁進行字符串運算(如拼接、替換、刪除等),并且運行在多線程環境中,則可以考慮使用StringBuffer,例如XML解析、HTTP參數解析和封裝。
使用StringBuilder類的場景:在頻繁進行字符串運算(如拼接、替換、和刪除等),并且運行在單線程的環境中,則可以考慮使用StringBuilder,如SQL語句的拼裝、JSON封裝等。
三、分析
簡要的說, String 類型和 StringBuffer 類型的主要性能區別其實在于 String 是不可變的對象, 因此在每次對 String 類型進行改變的時候其實都等同于生成了一個新的 String 對象,然后將指針指向新的 String 對象。所以經常改變內容的字符串最好不要用 String ,因為每次生成對象都會對系統性能產生影響,特別當內存中無引用對象多了以后, JVM 的 GC 就會開始工作,那速度是一定會相當慢的。
而如果是使用 StringBuffer 類則結果就不一樣了,每次結果都會對 StringBuffer 對象本身進行操作,而不是生成新的對象,再改變對象引用。所以在一般情況下我們推薦使用 StringBuffer ,特別是字符串對象經常改變的情況下。而在某些特別情況下, String 對象的字符串拼接其實是被 JVM 解釋成了 StringBuffer 對象的拼接,所以這些時候 String 對象的速度并不會比 StringBuffer 對象慢,而特別是以下的字符串對象生成中, String 效率是遠要比 StringBuffer 快的:
1
2
|
String S1 = “This is only a " + “ simple" + “ test"; StringBuffer Sb = new StringBuilder(“This is only a ").append(“ simple" ).append(“ test"); |
你會很驚訝的發現,生成 String S1 對象的速度簡直太快了,而這個時候 StringBuffer 居然速度上根本一點都不占優勢。其實這是 JVM 的一個把戲,在 JVM 眼里,這個
1
|
String S1 = “This is only a " + “ simple" + “test"; |
其實就是:
1
|
String S1 = “This is only a simple test"; |
所以當然不需要太多的時間了。但大家這里要注意的是,如果你的字符串是來自另外的 String 對象的話,速度就沒那么快了,譬如:
1
2
3
4
|
String S2 = "This is only a" ; String S3 = "simple" ; String S4 = "test" ; String S1 = S2 +S3 + S4; |
這時候 JVM 會規規矩矩的按照原來的方式去做。
四、深入JVM的優化處理
真的會有上面的性能代價么,字符串拼接這么常用,沒有特殊的處理優化么,答案是有的,這個優化進行在JVM編譯.java到bytecode時。
一個Java程序如果想運行起來,需要經過兩個時期,編譯時和運行時。在編譯時,Java JVM(Compiler)將java文件轉換成字節碼。在運行時,Java虛擬機(JVM)運行編譯時生成的字節碼。通過這樣兩個時期,Java做到了所謂的一處編譯,處處運行。
我們實驗一下編譯期都做了哪些優化,我們制造一段可能會出現性能代價的代碼。
1
2
3
4
5
6
7
8
9
|
public class Concatenation { public static void main(String[] args) { String userName = "Andy" ; String age = "24" ; String job = "Developer" ; String info = userName + age + job; System.out.println(info); } } |
對Concatenation.java進行編譯一下。得到Concatenation.class
1
|
javac Concatenation.java |
然后我們使用javap反編譯一下編譯出來的Concatenation.class文件。javap -c Concatenation。如果沒有找到javap命令,請考慮將javap所在目錄加入環境變量或者使用javap的完整路徑。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
|
17:22:04-androidyue~/workspace_adt/strings/src$ javap -c Concatenation Compiled from "Concatenation.java" public class Concatenation { public Concatenation(); Code: 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return public static void main(java.lang.String[]); Code: 0: ldc #2 // String Andy 2: astore_1 3: ldc #3 // String 24 5: astore_2 6: ldc #4 // String Developer 8: astore_3 9: new #5 // class java/lang/StringBuilder 12: dup 13: invokespecial #6 // Method java/lang/StringBuilder."<init>":()V 16: aload_1 17: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 20: aload_2 21: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 24: aload_3 25: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 28: invokevirtual #8 // Method java/lang/StringBuilder.toString:()Ljava/lang/String; 31: astore 4 33: getstatic #9 // Field java/lang/System.out:Ljava/io/PrintStream; 36: aload 4 38: invokevirtual #10 // Method java/io/PrintStream.println:(Ljava/lang/String;)V 41: return } |
其中,ldc,astore等為java字節碼的指令,類似匯編指令。后面的注釋使用了Java相關的內容進行了說明。 我們可以看到上面有很多StringBuilder,但是我們在Java代碼里并沒有顯示地調用,這就是JavaJVM做的優化,當JavaJVM遇到字符串拼接的時候,會創建一個StringBuilder對象,后面的拼接,實際上是調用StringBuilder對象的append方法。這樣就不會有我們上面擔心的問題了。
五、僅靠JVM優化?
既然JVM幫我們做了優化,是不是僅僅依靠JVM的優化就夠了呢,當然不是。
下面我們看一段未優化性能較低的代碼
1
2
3
4
5
6
7
|
public void implicitUseStringBuilder(String[] values) { String result = "" ; for ( int i = 0 ; i < values.length; i ++) { result += values[i]; } System.out.println(result); } |
使用javac編譯,使用javap查看
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
|
public void implicitUseStringBuilder(java.lang.String[]); Code: 0: ldc #11 // String 2: astore_2 3: iconst_0 4: istore_3 5: iload_3 6: aload_1 7: arraylength 8: if_icmpge 38 11: new #5 // class java/lang/StringBuilder 14: dup 15: invokespecial #6 // Method java/lang/StringBuilder."<init>":()V 18: aload_2 19: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 22: aload_1 23: iload_3 24: aaload 25: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 28: invokevirtual #8 // Method java/lang/StringBuilder.toString:()Ljava/lang/String; 31: astore_2 32: iinc 3, 1 35: goto 5 38: getstatic #9 // Field java/lang/System.out:Ljava/io/PrintStream; 41: aload_2 42: invokevirtual #10 // Method java/io/PrintStream.println:(Ljava/lang/String;)V 45: return |
其中8: if_icmpge 38 和35: goto 5構成了一個循環。8: if_icmpge 38的意思是如果JVM操作數棧的整數對比大于等于(i < values.length的相反結果)成立,則跳到第38行(System.out)。35: goto 5則表示直接跳到第5行。
但是這里面有一個很重要的就是StringBuilder對象創建發生在循環之間,也就是意味著有多少次循環會創建多少個StringBuilder對象,這樣明顯不好。赤裸裸地低水平代碼啊。
稍微優化一下,瞬間提升逼格。
1
2
3
4
5
6
|
public void explicitUseStringBuider(String[] values) { StringBuilder result = new StringBuilder(); for ( int i = 0 ; i < values.length; i ++) { result.append(values[i]); } } |
對應的編譯后的信息
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
public void explicitUseStringBuider(java.lang.String[]); Code: 0: new #5 // class java/lang/StringBuilder 3: dup 4: invokespecial #6 // Method java/lang/StringBuilder."<init>":()V 7: astore_2 8: iconst_0 9: istore_3 10: iload_3 11: aload_1 12: arraylength 13: if_icmpge 30 16: aload_2 17: aload_1 18: iload_3 19: aaload 20: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 23: pop 24: iinc 3, 1 27: goto 10 30: return |
從上面可以看出,13: if_icmpge 30和27: goto 10構成了一個loop循環,而0: new #5位于循環之外,所以不會多次創建StringBuilder.
總的來說,我們在循環體中需要盡量避免隱式或者顯式創建StringBuilder. 所以那些了解代碼如何編譯,內部如何執行的人,寫的代碼檔次都比較高。
六、結論
在大部分情況下 StringBuffer > String
Java.lang.StringBuffer是線程安全的可變字符序列。一個類似于 String 的字符串緩沖區,但不能修改。雖然在任意時間點上它都包含某種特定的字符序列,但通過某些方法調用可以改變該序列的長度和內容。在程序中可將字符串緩沖區安全地用于多線程。而且在必要時可以對這些方法進行同步,因此任意特定實例上的所有操作就好像是以串行順序發生的,該順序與所涉及的每個線程進行的方法調用順序一致。
StringBuffer 上的主要操作是 append 和 insert 方法,可重載這些方法,以接受任意類型的數據。每個方法都能有效地將給定的數據轉換成字符串,然后將該字符串的字符追加或插入到字符串緩沖區中。append 方法始終將這些字符添加到緩沖區的末端;而 insert 方法則在指定的點添加字符。
例如,如果 z 引用一個當前內容是“start”的字符串緩沖區對象,則此方法調用 z.append(“le”) 會使字符串緩沖區包含“startle”(累加);而 z.insert(4, “le”) 將更改字符串緩沖區,使之包含“starlet”。
在大部分情況下 StringBuilder > StringBuffer
java.lang.StringBuilder一個可變的字符序列是JAVA 5.0新增的。此類提供一個與 StringBuffer 兼容的 API,但不保證同步,所以使用場景是單線程。該類被設計用作 StringBuffer 的一個簡易替換,用在字符串緩沖區被單個線程使用的時候(這種情況很普遍)。如果可能,建議優先采用該類,因為在大多數實現中,它比 StringBuffer 要快。兩者的使用方法基本相同。