Java简述 String 字符串优化处理

String对象及其特点

不变性
String 对象一旦生成，则不能再对其进行改变，不变性可以泛化成不变模式，即一个对象创建之后就不会再发生改变。不变模式主要作用在于一个对象需要被多线程共享，当访问频繁的时候，可以省去锁和同步的等待时间，提高系统性能。
针对常量池优化
当两个 String 对象拥有相同值的时候，它们只引用常量池的同一个拷贝，当同一个字符串大量出现的时候，可以大幅度节省内存空间。
类的 final 定义
作为 final 类的 String 对象在系统中不可能有任何子类，这是对系统安全性对保护。

subString() 方法存在内存泄漏

subString() 是截取字符串常用的操作之一，但是这个方法在 JDK 中存在严重的内存泄漏问题，原因大家可以自行谷歌，下面介绍怎样优化处理：

import java.util.ArrayList;
import java.util.List;

public class SubStrLeakTest {
    public static void main(String args[]) {
         List<String> handler = new ArrayList<String>();
         /**
          * Huge不到1000 次 就oom
          * 但是ImprovedHuge 不会
          */
         for(int i = 0; i < 1000; i++) {
            // HugeStr h = new HugeStr();选择一个执行
            ImprovedHugeStr h = new ImprovedHugeStr();
             handler.add(h.getSubString(1, 5));
         }
    }

    static class HugeStr {
        private String str = new String(new char[100000]);
        public String getSubString(int begin, int end) {
            return str.substring(begin, end);
        }
    }
    
    static class ImprovedHugeStr {
        private String str = new String(new char[100000]);
        public String getSubString(int begin, int end) {
            return new String(str.substring(begin, end));
        }
    }
}

使用ImprovedHugeStr能够很好的工作，不会出现内存泄漏，保证系统的安全稳定。

字符串的分割和查找

最原始的字符串分割 sqlit(String regex)
它提供了非常强大的字符串分割功能，传入的参数可以是正则表达式，从而进行复杂逻辑的字符串分割。但是在性能敏感的系统中频繁使用是不可取的。

//对字符串构造
StringBuffer sb = new StringBuffer();
for(int i = 0; i < 10000; i++){
  sb.append("i");
  sb.append(";");
}
orgStr = sb.toString();

//对字符串进行10000次分割
for(int i = 0; i < 10000; i++){
  orgStr,split(";");//运行时间花费3703ms
}

使用效率更高的 StringTokenizer(String str, String delim)
str为需要分割的字符串，delim为分割符号,hasMoreTokens() 方法判断是否有更多的子字符串需要处理，nextToken() 得到下一个分割的字符串。

StringTokenizer st = new StringTokenizer(orgStr, ";");
for(int i = 0; i < 10000; i++){
  while(st.hasMoreTokens()){
    st.nextToken();
  }
  st = new StringTokenizer(orgStr, ";");
//执行时间2704ms
//StringTokenizer不断被创建，效率还是高于split()
}

indexOf(char ch)
返回指定字符 ch 在字符串中的位置
自定义字符串分割算法如下：

String tmp = orgStr;
for(int i = 0; i < 10000; i++){
  while(true){
      String splitStr = null;
      int j = tmp.indexOf(";");
      if (j < 0) {
        break;
      }
      splitStr = tmp.subString(0, j);
      tmp = tmp.subString(j + 1);
    }
    tmp = orgStr;
}

使用这种算法仅仅花费671ms，性能远远超过 split() 和 StringTokenizer()

高效率的 charAt() 方法
public char charAt(int index)
他返回指定位置 index 的字符，它的功能和 indexOf() 相反，效率和它一样高，在软件开发的过程中，经常会遇到这样的问题：判断一个字符串的开始和结束字符串是不是等于某个字串。常用的方法是：

//判断某个字串是不是开头
public boolean startsWith(String prefix)
//判断某个字串是不是结束
public boolean endsWith(String suffix)

这常用的方法其效率远远低于charAt()方法。判断orgStr是否以"abc"开始或结束,使用charAt() 方法实现：

int len = orgStr.lenth();
if(orgStr.charAt(0) == 'a' 
              && orgStr.charAt(1) == 'b' 
              && orgStr.charAt(2) == 'c');
if(orgStr.charAt(len-1) == 'a' 
              && orgStr.charAt(len-2) == 'b' 
              && orgStr.charAt(len-3) == 'c');

使用orgStr.stratsWith()和orgStr.endsWith()实现：

orgStr.stratsWith("abc");
orgStr.endsWith("abc");

第一段代码耗时15ms，第二段耗时32ms，在性能敏感的系统中，使用charAt()是个不错的选择。

StringBuffer 和 StringBuilder

String 常量的累加操作

//第一段代码
String result = "String " + "and" + "String" + "append";
//第二段代码
StringBuilder result = new StringBuilder();
result.append("String");
result.append("and");
result.append("String");
result.append("append");

将两段代码循环5万次，得到第一段0ms，第二段15ms，原来设想第一段是先实现一个”Stringand“ + "String" + "append"，这样执行效率不如第二段，通过反编译得到：对于字符串的累加，Java在编译时就做了彻底充分的优化和计算，将多个连接操作的字符串在编译时合成一个单独的长字符串

构建超大的 String 对象

//第一段代码
for(int i = 0;  i < 10000; i++){
      str = str + i;
}
//第二段代码
for(int i = 0;  i < 10000; i++){
      result = result.concat(String.valueOf(i));
}
//第二段代码
StringBuilder sb = new StringBilder();
for(int i = 0;  i < 10000; i++){
      sb.append(i);
}

三段代码各自执行1万次循环，第一段耗时1062ms，第二段耗时360ms；第三段耗时0ms。这个例子表明：String的加法操作虽然会被优化，但编译器显然不够聪明，因此对于String 操作，类似于“+”和"+="的运算符应该尽量少用，其次concat() 方法效率比“+”要高，比StringBuilder要低。

StringBuilder 和 StringBuffer 选哪个
在无需考虑线程安全的情况下可以使用性能相对较好的 StringBuilder，但若系统有线程安全要求，只能选择 StringBuffer
容量参数
这两个字符串操作都可以指定容量

public StringBuilder(int capacity)
public StringBuffer(int capacity)

代码例子：

//下面两段选一段执行
StringBuilder sb = new StringBuilder(5888890);
StringBuffer sb = new StringBuffer(5888890);
for(int i = 0; i < 50000; i++){
      sb.append(i);
}

如果能预先评估StringBuilder的大小，将能有效的节省这些操作，从而提高系统性能，指定容量的比没有指定的要更优一些。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,402评论 6赞 499
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,377评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,483评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,165评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,176评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,146评论 1赞 297
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,032评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,896评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,311评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,536评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,696评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,413评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,008评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,659评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,815评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,698评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,592评论 2赞 353

Java简述 String 字符串优化处理

String对象及其特点

subString() 方法存在内存泄漏

字符串的分割和查找

StringBuffer 和 StringBuilder

推荐阅读更多精彩内容