java字符串切割

标签(空格分隔): java


方法一:split() 方法——JDK 1.4 or later##

例子:

public class StringSplit {
    public static void main(String[] args) {
    //一般用法
        String sourceStr = "1,2,3,4,5";
        String[] sourceStrArray = sourceStr.split(",");
        for (int i = 0; i < sourceStrArray.length; i++) {
            System.out.println(sourceStrArray[i]);
        }

        // 限定最多分割出3个字符串
        int maxSplit = 3;
        sourceStrArray = sourceStr.split(",", maxSplit);
        for (int i = 0; i < sourceStrArray.length; i++) {
            System.out.println(sourceStrArray[i]);
        }
    }
}
//输出结果:
1
2
3
4
5
1
2
3,4,5

分隔符如果用到一些特殊字符,可能会得不到我们预期的结果。在正则表达式中有特殊的含义的字符,我们使用的时候必须进行转义

public class StringSplit {
    public static void main(String[] args) {
        String value = "192.168.128.33";
        // 注意要加\\,要不出不来,yeah
        String[] names = value.split("\\.");
        //String[] output = test.split(Pattern.quote("."));
        //使用 \\ 跟使用Pattern.quote的效果一样
        for (int i = 0; i < names.length; i++) {
            System.out.println(names[i]);
        }
    }
}
//转义字符总结
1.字符 "|"  "*"  "+"  "."  "," 在正则表达式中用\\.表示,或者用Pattern.quote方法表示。
2.而如果是"\",那么就得写成"\\\\"。
3.如果一个字符串中有多个分隔符,可以用"|"作为连字符。

字符串中有多个分隔符,可以用"|"作为连字符的例子:

public static void main(String[] args)
    {
            
            String str ="Java string-split#test";
            String[] sourceStrArray = str.split(" |-|#");
 //注意上面的(" |-|#")的一开始的字符就是空格,看上去好像没写一样喔
            for (int i = 0; i < sourceStrArray.length; i++) {
                System.out.println(sourceStrArray[i]);
            }
    }

有时在分割字符串之前需要对字符串进行一些检查,如:

public static void main(String[] args)
{

        String test = "abc.def.123";
        //开始检查
        if(test.contains(".")){
             String[] output = test.split("\\.");
             //第二次检查
                if(output.length!=3){
throw new IllegalArgumentException(test + " - invalid format!");
                 }else{
                    System.out.println(output[0]);
                    System.out.println(output[1]);
                    System.out.println(output[2]);
                        }
                }else{
throw new IllegalArgumentException(test + " - invalid format!");
                }
                
        }

高级用法:结合正则表达式
但是使用正则的话,效率肯定是有问题的

public class Test01 {  
    public static void main(String[] args) {  
        String str = "one123";  
        String regex = "(?<=one)(?=123)";  
        // String regex = "(?<=one)"; 效果和上面的那句一样
        String[] strs = str.split(regex);  
        for(int i = 0; i < strs.length; i++) {  
            System.out.printf("strs[%d] = %s%n", i, strs[i]);  
        }  
    }  
}  
结果输出:
strs[0] = one
strs[1] = 123
为什么呢?表示对正则表达式不是太懂????

方法二:StringTokenizer ——从JDK1.0开始便可以使用StringTokenizer,JDK1.4开始才有String.split()。

注意:StringTokenizer是老版本对方法,因为兼容性的原因不鼓励使用,推荐使用String.split()。但是StringTokenizer效率高,在后文的三种方法的比较中会说到

简单用法例子:

public static void main(String[] args) {
     String test = "abc.def.123";
      StringTokenizer token = new StringTokenizer(test, ".");
            while (token.hasMoreTokens()) {
             //利用循环来获取字符串str1中下一个语言符号
                System.out.println(token.nextToken());
            }
        }
输出结果:
abc
def
123

格外注意:对于两个分隔符之间的空字符串会忽略。例如:

 public static void main(String[] args) {
       String ip = "192.168.123..33";//两个点之间是空字符串
//   String ip = "192.168.123. .33";//两个点之间是空格
        StringTokenizer token=new StringTokenizer(ip,".");  
        while(token.hasMoreElements()){
//注意这里用的是hasMoreElements()跟hasMoreTokens()效果一样
         System.out.print(token.nextToken()+"  ");  
        } 

    }
输出结果:192  168  123  33 //注意"192.168.128...33"中间的...这三个点中间是有两个空字符串,是空字符串,而不是空格喔!!因为是空字符串,所以切出来的也是空,什么都没有

例子二:
int num1 = strT1.countTokens();//获取字符串str1后的个数
hasMoreElements()跟hasMoreTokens()效果一样
String nextToken()
返回此 string tokenizer 的下一个标记。
String nextToken(String delim)
返回此 string tokenizer 的字符串中的下一个标记。

public static void main(String[] args)
    {
            String str1 = "Hello world!This is Java code,stringTokenizer Demo.";
            //声明并初始化字符串str1
            String str2 = "How to use StringTokenizer?StringTokenizer?";
            //声明并初始化字符串str2
            StringTokenizer strT1 = new StringTokenizer(str1," ,.!");
            //创建StringTokenizer类的对象strT1,并构造字符串str1的分析器
            //以空格符、","、"."及"!"作为定界符
            StringTokenizer strT2 = new StringTokenizer(str2," ?");
            //创建StringTokenizer类的对象strT2,并构造字符串str2的分析器
            //以空格符及"?"作为定界符
            int num1 = strT1.countTokens();
            //获取字符串str1中语言符号的个数
         int num2 = strT2.countTokens();
            //获取字符串str2中语言符号的个数
            System.out.println("str1 has "+num1+" words.They are:");
            while(strT1.hasMoreTokens())
            {   //利用循环来获取字符串str1中下一个语言符号,并输出
                   String str = strT1.nextToken();
                   System.out.print("\""+str+"\" ");
            }
            System.out.println("\nstr2 has "+num2+" words.They are:");
            while(strT2.hasMoreElements())
            {   //利用循环来获取字符串str2中下一个语言符号,并输出
                    String str = strT2.nextToken();
                   System.out.print("\""+str+"\" ");
            }
    }

注意还有一个一个参数的StringTokenizer(String str)构造方法
使用默认的定界符,即空格符(如果有多个连续的空格符,则看作是一个)、换行符、回车符、Tab符号等
例子;

    String str1 ="A B   \nC";//情况一C,将空格符、换行符作为定界符,多个连续的空格符,则看作是一个
    //String str1 ="A B   \\nC";情况二,在情况一的基础上将换行符用“\”转义了
    StringTokenizer strT1 = new StringTokenizer(str1);
     while(strT1.hasMoreTokens())
        {   //利用循环来获取字符串str1中下一个语言符号,并输出
                   String str = strT1.nextToken();
                   System.out.print("'"+str+"'");
            }
输出结果:情况一:'A''B''C'
          情况二:'A''B''\nC'

方法三:使用String的两个方法—indexOf()和subString()——subString()是采用了时间换取空间技术,因此它的执行效率相对会很快,只要处理好内存溢出问题,但可大胆使用。而indexOf()函数是一个执行速度非常快的方法##

1、substring(int begin);截取掉s从首字母起长度为begin的字符串,将剩余字符串赋值给s;

 String text ="我爱你";
            String temp= text.substring(1);
            System.out.println(temp); 
输出:爱你

2、substring(int begin,int end);截取s中从begin开始至end结束时的字符串,并将其赋值给s;注意:不包括end

  String text ="我爱你们";
            String temp= text.substring(0,2);
            System.out.println(temp); 
输出:我爱

3、indexOf(subString[, startIndex])返回 String 对象内第一次出现子字符串的字符位置。 如果没有找到子字符串,则返回 -1。
subString 必选项。要在 String 对象中查找的子字符串。
starIndex 可选项。该整数值指出在 String 对象内开始查找的索引。如果省略,则从字符串的开始处查找。

额外注意的:charAt():charAt()方法可用来获取指定位置的字符串,index为字符串索引值,从0开始到string.leng - 1,若不在这个范围将返回一个空字符串

var str = 'abcde';
console.log(str.charAt(2));        //返回c
console.log(str.charAt(8));        //返回空字符串

lastIndexOf()语法与indexOf()类似,它返回的是一个指定的子字符串值最后出现的位置,其检索顺序是从后向前。

将indexOf()和subString()结合来截取的例子

//这个做法十分巧妙
public static void out(){
        String str = "我爱你们,你爱他,他爱她们加一,她爱他";  
//因为不知道到底截取完之后有多少个,所以用集合保存
        List  stringList =new ArrayList<String>();
        String temp = str;  
            while (true) {  
                String splitStr = null; 
                int index = temp.indexOf(",");  
                if (index < 0) {  
                    break;  
                }  
                splitStr = temp.substring(0, index);  
                System.out.println(splitStr);
                stringList.add(splitStr);
                temp = temp.substring(index + 1);  
            }  
    } 

如果十分有规律的话,也可以像下面这样做


此处输入图片的描述
此处输入图片的描述

上面的做法虽然是可以但是有点笨,其实可以有聪明点的做法:

适合情况:当分隔符是一个字符时
private static List<String> split2( final String str )
{
    final List<String> res = new ArrayList<String>( 10 );
    int pos, prev = 0;
    while ( ( pos = str.indexOf("" + m_separatorChar, prev ) ) != -1 )
    {
        res.add( str.substring( prev, pos ) );
        prev = pos + 1; // start from next char after separator
    }
    res.add( str.substring( prev ) );
    return res;
}
适合情况:当分隔符是多个字符时
private static List<String> split( final String str )
{
    final List<String> res = new ArrayList<String>( 10 );
    int pos, prev = 0;
    while ( ( pos = str.indexOf( m_separator, prev ) ) != -1 )
    {
        res.add( str.substring( prev, pos ) );
        prev = pos + m_separator.length(); // start from next char after separator
    }
    res.add( str.substring( prev ) );
    return res;
}

三种方法的比较:##

1、String.split(String.split是用正则表达式匹配,所以不使用KMP字符串匹配算法)用的都是按顺序遍历的算法,时间复杂度O(m*n),较高,所以性能上,StringTokenizer好很多,对于频繁使用字符串分割的应用,例如etl数据处理,使用StringTokenizer性能可以提高很多。

2、在split需要被大量调用的场合,在现有的Android VM里面,String类的split方法肯定是不符合要求的,StringTokenizer是最廉价的替换split的方法,简单修改成这个实现之后,花费时间能提升一个数量级

3、indexOf结合subString经过充分的优化,对于结构化特别是表格类的数据,效率是最快的

Java 字符串操作常用的各种的方法

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,817评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,329评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,354评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,498评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,600评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,829评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,979评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,722评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,189评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,519评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,654评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,329评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,940评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,762评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,993评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,382评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,543评论 2 349

推荐阅读更多精彩内容

  • 第5章 引用类型(返回首页) 本章内容 使用对象 创建并操作数组 理解基本的JavaScript类型 使用基本类型...
    大学一百阅读 3,216评论 0 4
  • Javascript有很多字符串的方法,有的人有W3C的API,还可以去MDN上去找,但是我觉得API上说的不全,...
    顽皮的雪狐七七阅读 2,143评论 0 2
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,598评论 18 399
  • 1 当你看到标题,有没有立刻想到田震的那首歌曲:“我家住在黄土高坡,大风从坡上刮过,不管是西北风,还是东南风,都是...
    小苜蓿阅读 708评论 18 15
  • 1 环境搭建 查看php环境信息 2 下载地址 Laravel 中文网 Laravel 利用 Composer(C...
    捔落纏綿阅读 1,874评论 0 0