Linux中[]中括号匹配问题[A-Z]会匹配小写a-z:
在Ubuntu使用[]进行匹配时,发现ls [A-Z]*仍然可以匹配到小写字母开头的目录,这是因为语系不同,导致编码顺序不同:
LANG=C:ABC...Zabc...z
LANG=zh_CN: aAbBcC...zZ
当语系为zh_CN,[a-z] 就会包括ABC..Y
如果要用[A-Z]只表示大写字母范围,需要设置环境变量
export LC_ALL=C
取消用
unset LC_ALL
在很多shell脚本中在开头部分加LC_ALL=C就是为了去除所有本地化的设置,让命令能正确执行。
在Linux中通过locale来设置程序运行的不同语言环境,locale由ANSI C提供支持。locale的命名规则为<</span>语言>_<</span>地区>.<</span>字符集编码>,如zh_CN.UTF-8,zh代表中文,CN代表大陆地区,UTF-8表示字符集。在locale环境中,有一组变量,代表国际化环境中的不同设置:
- LC_COLLATE
定义该环境的排序和比较规则 - LC_CTYPE
用于字符分类和字符串处理,控制所有字符的处理方式,包括字符编码,字符是单字节还是多字节,如何打印等。是最重要的一个环境变量。 - LC_MONETARY
货币格式 - LC_NUMERIC
非货币的数字显示格式 - LC_TIME
时间和日期格式 - LC_MESSAGES
提示信息的语言。另外还有一个LANGUAGE参数,它与LC_MESSAGES相似,但如果该参数一旦设置,则LC_MESSAGES参数就会失效。LANGUAGE参数可同时设置多种语言信息,如LANGUANE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"。 - LANG
LC_的默认值,是最低级别的设置,如果LC_没有设置,则使用该值。类似于 LC_ALL。 - LC_ALL
它是一个宏,如果该值设置了,则该值会覆盖所有LC_*的设置值。注意,LANG的值不受该宏影响。
C"是系统默认的locale,"POSIX"是"C"的别名。所以当我们新安装完一个系统时,默认的locale就是C或POSIX。
参考链接:
https://blog.csdn.net/z4213489/article/details/7937894(推荐,更为详细,通俗易懂)
http://blog.sina.com.cn/s/blog_81b27a5a0101gkqf.html