String这个对象尤其特别,在java中,属于引用数据类型。
接下来让我们先看一段代码:
String str1 = "hello world";
String str2 = "hello world";
String str3 = str2;
System.out.println(str2 == str3); //true
str3 = "see you";
System.out.println(str1 == str2); //true
System.out.println(str2 == str3); //false
我们知道,String是引用对象,引用对象每创建一个即在堆中分配一个内存空间,按照正常情况,str1和str2应该是在不同的地址,“=”判断时应该为false,接下来慢慢解释这是为什么。
String是由final描述的,所以它是一个常量,具有不可变性,所以str2==str3是false
我们的String对象是存在常量池里的,在我们的编程中,有很大一部分都在和字符串打交道,常量池的存在,为字符串的使用提升了效率,并且减少了内存分配。
当我们直接String str1="hello world"时,jvm会做两件事,首先会去常量池看看有没有“hello world”这个常量,有的话,直接返回其地址,如果没有,则动态地在常量池里创建这个常量,并返回其地址。所以str1==str2是true
String str1 = "hello world";
String str4 = new String("hello world");
System.out.println(str1 == str4); //false
当我们new一个String对象时,会在堆里分配内存存储String实例,在常量池里也会创建这个常量,但是返回的是在堆里的地址,所以str1==str4是false
String str1 = "hello world";
String str2 = new String("hello world");
System.out.println(str1 == str2.intern()); //true
System.out.println(str2 == str2.intern()); //false
String.intern()这个方法就是先判断这个常量是否存在常量池,如果存在则直接返回该常量的引用,如果常量池里没有,则动态在常量池里创建,并返回引用。
在jdk1.7之前,常量池放在了方法区的持久层,jdk1.7之后,常量池放在堆里,如果常量池里没有这个常量,那么就是在常量池里复制这个对象的引用,返回的也是当前对象的引用(我的jdk版本为1.8)
接下来用简单的例子详解一下。
String a1 = "AA";
System.out.println(a1 == a1.intern()); // true
String a1="AA";常量池里创建了“AA”这个常量,a1指向常量池,a1.intern()会去常量池里找,存在,返回了AA”常量池里的地址,故true
String a2 = new String("B");
a2.intern();
String a3 = new String("B");
System.out.println(a2 == a3.intern()); // false
System.out.println(a3 == a3.intern()); // false
首先,在堆里创建一个“B”,然后在常量池也创建了一个“B”,a2指向堆,a2.intern()首先会去常量池查找“B”常量,存在则,不做任何操作a3同理,也是指向堆里的另一块内存。a3.intern()去常量池里找,存在,返回常量池里的地址。而a2和a3都是指向堆里的地址,故false
接着看下面的例子
String a2 = new String("B") + new String("B");
a2.intern();
String a3 = new String("B") + new String("B");
System.out.println(a2 == a2.intern()); // true
System.out.println(a2 == a3.intern()); // true
System.out.println(a3 == a3.intern()); // false
第一行:new了两个“B”,jvm先在堆里开辟两块内存区域存“B”,然后去常量池里动态创建常量“B”,然后在堆里创建了“BB”,a2指向堆里的“BB”
第二行:a2.intern()去常量池里查找是否存在“BB”,不存在,则将a2的引用复制一份存在常量池,返回的是a2在堆里的地址,所以a2==a2.intern()为true
第三行:跟a2的操作一样,常量池已经有了“B”,所以这一步在常量池里不创建常量
a3.intern()会先去常量池里查找是否存在“BB”,存在,且是a2的引用,即返回a2的引用,指向的是a2在堆里的地址。所以a2==a3.intern()为true