String拼接出现null?你看到的分析可是错的
前言
String类型真是个神奇的存在,动不动就会出现一些迷惑人的错误。今天看到一篇文中提到当String的值为null时,进行字符串相加拼接,会出现把null当做字符串拼接的现象。
比如下面这段代码:
String s = null; s = s + "hello"; System.out.println(s + " world");
你预期的结果可能是“hello world”,但实际的结果是“nullhello world”,神奇吧。
其实这倒没什么,实践一下就可以看到结果。但当你好奇心作祟,在网上搜为什么时,你看到的答案可能是错的。
我在搜索时,看到访问量上万的文章给出的解释竟然错误的。为了排除一些误导,特意为大家分析一下原因。
错误的原因分析
如果对上述问题进行搜索,你可能看到的答案是:
s + " world" 等价于 s = String.valueOf(s)+"word";
然后附带valueOf方法:
public static String valueOf(Object obj) { return (obj == null) ? "null" : obj.toString(); }
你信了吗?如果信了可能真的就错了。下面我们就来分析分析为什么错了。
Java编译器的优化
我们知道,当我们写下面的代码时Java编译器会为我们做一些优化:
String a = "Hello "; String b = "World"; System.out.println(a + b);
如何优化的?上面这段代码经过编译器优化之后,等价于:
StringBuilder sb = new StringBuilder(); sb.append("Hello "); sb.append("World"); String result = sb.toString(); System.out.println(result);
也就是说,加号操作会被优化基于StringBuilder的操作,而并不是上面提到的String.valueOf操作。
那么,上面为null的情况也就等价于下面的操作了:
StringBuilder sb = new StringBuilder(null); sb.append("hello"); sb.append(" world"); String result = sb.toString(); System.out.println(result);
此时,我们再看一下StringBuilder(null)这个构造方法的底层实现,最终调到它的父类AbstractStringBuilder中的append方法:
public AbstractStringBuilder append(String str) { if (str == null) return appendNull(); int len = str.length(); ensureCapacityInternal(count + len); str.getChars(0, len, value, count); count += len; return this; }
对应的appendNull方法实现为:
private AbstractStringBuilder appendNull() { int c = count; ensureCapacityInternal(c + 4); final char[] value = this.value; value[c++] = 'n'; value[c++] = 'u'; value[c++] = 'l'; value[c++] = 'l'; count = c; return this; }
在appendNull方法中就是将null当做字符串“null”来处理了。这也就是为什么会在拼接中出现null的原因。
字节码追踪
针对上述示例,如果你想看编译器是如何处理的,可以通过javap -c 命令来查看对应字节码:
通过字节码可以看出,基本上与上面的分析的一致。所以说,尽信书不如无书。
拓展问题
解决了上述问题,再来看看,如果我们单纯的就打印null是怎么输出的?
String s = null; System.out.println(s);
执行上述程序,控制台打印null,这个null是哪儿来的呢?直接看println的底层实现:
public void print(String s) { if (s == null) { s = "null"; } write(s); }
最终调用到了print方法,如果为null,则打印null字符串。
支持,还没有出现最初的valueOf方法,那么valueOf方法在什么场景下会用到呢?在对象为Object类型时:
Object s = null; String s1 = String.valueOf(s); System.out.println(s1);
也就是说在明确调用valueOf方法时,此时s1的值直接是null字符串。
再拓展一下,针对一些基础类型的包装类,比如Integer、Double等:
Integer i = null; System.out.println(i);
上述代码的处理又不太一样,println方法实现如下:
public void println(Object x) { String s = String.valueOf(x); synchronized (this) { print(s); newLine(); } }
也就是说先对对应的Object对象调用valueOf,回到上面的示例,如果Object为null,该方法返回null字符串,后续打印机直接为null。
小结
字符串拼接是很常见的问题,一不小心会出现将null给拼接上的情况。而这状况的出现又牵扯到Java编译器的优化,是不是很有意思?而且正如最开始所述,当我们在网络上搜索资料时也要辨证的去看待答案的准确性。
关注公众号:程序新视界,一个让你软实力、硬技术同步提升的平台
除非注明,否则均为程序新视界原创文章,转载必须以链接形式标明本文链接