文本处理-tr、grep、sed、cut、awk

文本处理,可以使用的工具挺多,主要有tr、grep、sed、cut、awk等。在这记录下他们主要的应用区别以及使用方法(待补充完善);
tr:translate的简写,主要用于压缩重复字符,删除文件中的控制字符以及进行字符转换操作。
grep:更适合单纯的查找或匹配文本
sed:更适合编辑匹配到的文本
cut:适合对文本进行截取操作
awk:更适合格式化文本,对文本进行较复杂格式处理

tr

translate的简写,主要用于压缩重复字符,删除文件中的控制字符以及进行字符转换操作。
用法:tr [OPTION]... SET1 [SET2]
常用参数:

#-s: squeeze-repeats,用SET1指定的字符来替换对应的重复字符
echo "aaabbbaacccfddd" | tr -s [abcdf] // abacfd
#-d:delete,删除SET1中指定的所有字符,不转换
echo "a12HJ13fdaADff" | tr -d "[a-z][A-Z]" //1213
#-t:truncate,将SET1中字符用SET2对应位置的字符进行替换,一般缺省为-t
echo "a1213fdasf" | tr -t [afd] [AFO] // A1213FOAsF
#-c:complement,用SET2替换SET1中没有包含的字符
cat a.txt | tr -c "[a-z][A-Z]" "#" | tr -s "#" | tr -t "#" "\n"
可简化为
cat a.txt | tr -cs "[a-z][A-Z]" "\n"
*****a.txt*******
Monday   09:00
Tuesday  09:10
Wednesday 10:11
Thursday  11:30
Friday   08:00
Saturday  07:40
Sunday   10:00
*****a.txt*******

grep

更适合单纯的查找或匹配文本

sed

更适合编辑匹配到的文本

用法:sed 选项 地址定界 编辑命令 文件

sed [选项][动作]

选项与参数:

-n :使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到终端上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。
-e :直接在命令列模式上进行 sed 的动作编辑;
-f :直接将 sed 的动作写在一个文件内, -f filename 则可以运行 filename 内的 sed 动作;
-r :sed 的动作支持的是延伸型正规表示法的语法。(默认是基础正规表示法语法)
-i :直接修改读取的文件内容,而不是输出到终端。

function:

a :新增行, a 的后面可以是字串,而这些字串会在新的一行出现(目前的下一行)
c :取代行, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行
d :删除行,因为是删除,所以 d 后面通常不接任何参数,直接删除地址表示的行;
i :插入行, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
p :列印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行
s :替换,可以直接进行替换的工作,通常这个 s 的动作可以搭配正规表示法,例如 1,20s/old/new/g 一般是替换符合条件的字符串而不是整行
地址定界方法有:

  • 空地址 :即对全文进行处理

  • 单地址

    • 指定行 #
    • 匹配行/pattern/
  • 地址范围

    • # ,#:从#号到#号
    • #,+#:从#号向下#号
    • #,/pattern/ : 从#号行到被模式匹配到的行
    • /pattern1/,/pattern2/ : 从模式1匹配到的行到被模式2匹配到的行
    • $:表示最后一行
  • 步进地址表示法

    • 1~2: 所有奇数行
    • 2~2: 所有偶数行
#d:删除模式空间内容
sed 'm,nd' filename; sed '/^2/d' filename; sed 'm~2d' filename; sed '//,//d' filename
#p:显示呗模式框定的内容
sed -n '1~2p' file; sed -n '/./p' file
#a \line : 追加line行至匹配到行的后面,如果是多行可使用\n实现多行追加
sed '/^UUID/ a\line1\nline2' file
#i \line : 添加line行到匹配行的前面,如果是多行可使用\n实现多行添加
sed '/^UUID/i \line1\nline2' file
#c \line : 把匹配到的行替换为line行
sed '/^UUID/c \newline' file
#! : 条件取反,一般用于模式之后,命令之前
sed '/^#/!d' FILE : 只显示非注释的行
#w /PATH : 将模式空间匹配到的行,写入指定文件中
sed '/#/!w ./w.txt' fstab : 匹配非#开始的行,并写入当前目录下的w.txt文件中
#r /PATH : 将PATH中指定的文件写入匹配到的行下方,多用于文件合并
sed '/^UUID/r ./w.txt' fstab :把当前目录下的w.txt文件写入到以UUID开头的行下

#s/// : 字符替换查找,其分隔符可自动指定,常用的有,s@@@、s###;g : 全局替换,如果只想从第几次开始替换,可使用3g即Ng
sed 's/love/& you' FILE: 将love替换为love you,&`表示对前面模式的引用
sed 's/^\(UUID\).*/Hello/' fstab1 : 将UUID开头的行替换为UUID Hello的内容
#类似应用
sed -r 's/.*#(.+)#.*/\1/'
sed 's/.*/&\n&/' file

cut

适合对文本进行截取操作,常用-c、-d、-f参数

awk

更适合格式化文本,对文本进行较复杂格式处理

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,651评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,468评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,931评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,218评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,234评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,198评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,084评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,926评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,341评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,563评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,731评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,430评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,036评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,676评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,829评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,743评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,629评论 2 354

推荐阅读更多精彩内容