Linux三剑客-grep、awk、sed

类比SQL

  • grep = select * from table
  • awk = select field from table
  • sed = update table set field = new where field = old

grep 命令

Linux grep 命令用于查找文件里符合条件的字符串。

语法
grep [-abcEFGhHilLnqrsvVwxy][-A<显示列数>][-B<显示列数>][-C<显示列数>][-d<进行动作>][-e<范本样式>][-f<范本文件>][--help][范本样式][文件或目录...]
常用参数

-i 或 --ignore-case : 忽略字符大小写的差别。
-o 或 --only-matching : 只显示匹配的字符串部分。
-n 或 --line-number : 在显示符合样式的那一行之前,标示出该行的列数编号。
-v 或 --revert-match : 显示不包含匹配文本的所有行。
-E 或 --extended-regexp : 使用扩展正则表达式。
-A -B -C 打印命中数据的上下文。
其他参数参考:https://www.runoob.com/linux/linux-comm-grep.html

pattern正则表达式
  • 基本表达式(BRE)

^ 开头 $ 结尾
[a-z][0-9] 区间
* 0个或多个

  • 扩展正则(ERE)

? 非贪婪匹配
+ 一个或者多个
() 分组
{} 范围约束
| 匹配多个表达式的任何一个

grep实例
  • 从三个文件里找到"hello"字符串:
$ grep "hello" file1 file2 file3
file1: hello world!
file2: hello
file3: hello linux!
  • 从三个文件里找到"hello"字符串,加入-o参数:
$ grep -o "hello" file1 file2 file3
file1: hello
file2: hello
file3: hello
  • 用参数-i不区分大小写查找字符串:
$ echo "AbC" | grep -i AB
AbC
  • 使用扩展正则表达式
$ echo "1234 7654" | grep -oE '[0-9]4'
34
54
$ echo "1234 7654" | grep -oE '[0-9]4|76'
34
76
54
  • 打印上下文
# 已有文件test.txt
hello 1
hello 2
hello 3
hello 4
hello 5
# -A代表after,即后面几行
$ cat test.txt | grep -A1 "hello 3"
hello 3
hello 4
$ cat test.txt | grep -A2 "hello 3"
hello 3
hello 4
hello 5
# -B代表before,即前面几行
$ cat test.txt | grep -B1 "hello 3"
hello 2
hello 3
$ cat test.txt | grep -B2 "hello 3"
hello 1
hello 2
hello 3
# -C代表context,即前面和后面几行
$ cat test.txt | grep -C1 "hello 3"
hello 2
hello 3
hello 4

awk 命令

awk是一种语言解析引擎,具备完整的编程特性,如执行命令、网络请求等。理论上来说,awk可以完全替代grep。
注意:尽量使用单引号,避免转义

awk语法
awk 'pattern{action}'
常用参数

awk 'BEGIN{}END{}' 开始和结束
awk '/Running/' 正则匹配
awk '/aa/,/bb/' 区间选择
awk '$2~/xxx/' 字段匹配
awk 'NR==2' 取第二行
awk 'NR>1' 去掉第一行

内置变量

FS 字段分隔符(每一行的字符串的分隔符)
OFS 输出数据的字段分隔符(用于合并列)
RS 记录分隔符(分成多行)
ORS 输出字段的行分隔符(用于合并行)
NF 字段数(每行的列数)
NR 记录数(行数)

awk的字段数据处理

-F 参数指定字段分隔符
BEGIN{FS="_"} 也可以表示分隔符
$0 代表原来的行
$1 代表第一个字端(相当于SQL里的第一列)
$N 代表第N个字段
$NF 代表最后一个字段

awk实例
  • 用BEGIN和END在前后打印内容
$ ps -ef | awk 'BEGIN{print "start"}{print $0}END{print "end"}'
start
     UID     PID    PPID  TTY        STIME COMMAND
      HC     337     336 pty0     15:56:42 /usr/bin/bash
      HC     571     337 pty0     17:20:44 /usr/bin/ps
      HC     336       1 ?        15:56:42 /usr/bin/mintty
end

使用正则匹配(支持扩展正则)

$ ps -ef | awk '/mintty/'
      HC     336       1 ?        15:56:42 /usr/bin/mintty
$ ps -ef | awk '/mintty|ps/'
      HC     611     337 pty0     17:23:40 /usr/bin/ps
      HC     336       1 ?        15:56:42 /usr/bin/mintty

区间选择匹配

$ ps -ef | awk '/m/,/y/'
      HC     336       1 ?        15:56:42 /usr/bin/mintty

NR过滤行

$ ps -ef
     UID     PID    PPID  TTY        STIME COMMAND
      HC     337     336 pty0     15:56:42 /usr/bin/bash
      HC     637     337 pty0     17:31:25 /usr/bin/ps
      HC     336       1 ?        15:56:42 /usr/bin/mintty
$ ps -ef | awk 'NR>1'
      HC     641     337 pty0     17:31:30 /usr/bin/ps
      HC     337     336 pty0     15:56:42 /usr/bin/bash
      HC     336       1 ?        15:56:42 /usr/bin/mintty
$ ps -ef | awk 'NR>2'
      HC     336       1 ?        15:56:42 /usr/bin/mintty
      HC     646     337 pty0     17:31:36 /usr/bin/ps

字段筛选

$ ps -ef | awk '{print $1}'
UID
HC
HC
HC
$ ps -ef | awk '{print $NF}'
COMMAND
/usr/bin/ps
/usr/bin/bash
/usr/bin/mintty
/usr/bin/bash

指定行分隔符,这里使用冒号分隔

$ echo $PATH
/c/Users/HC/bin:/mingw64/bin:/usr/local/bin:/usr/bin:/bin:/mingw64/bin:/usr/bin:/c/Users/HC/bin:/d/python/Scripts:/d/python:/d/python3.7/Scripts

$ echo $PATH | awk 'BEGIN{RS=":"}{print $0}'
/c/Users/HC/bin
/mingw64/bin
/usr/local/bin
/usr/bin
/bin
/mingw64/bin
/usr/bin
/c/Users/HC/bin
/d/python/Scripts
/d/python
/d/python3.7/Scripts

指定字段分隔符,这里指定"/"

$  echo $PATH | awk 'BEGIN{RS=":"}{print $0}' | awk 'BEGIN{FS="/"}{print $1,$2,$3,$4}'
 c Users HC
 mingw64 bin
 usr local bin
 usr bin
 bin
 mingw64 bin
 usr bin
 c Users HC
 d python Scripts
 d python
 d python3.7 Scripts

把单行拆分为多行

echo $PATH | awk 'BEGIN{RS=":"}{print $0}'
echo $PATH | awk 'BEGIN{RS=":"}{print NR,$0}'
echo $PATH | awk 'BEGIN{RS=":"}END{print NR}'

多行组合为单行

echo $PATH | awk 'BEGIN{RS=":"}{print $0}' | awk 'BEGIN{FS="\n";ORS=":"}{print $0}'

数据计算
这里相当于a=(10+20+30)/3=20

$ echo '1,10
> 2,20
> 3,30' | awk 'BEGIN{a=0;FS=","}{a+=$2}END{print a/ NR}'
20

sed 命令

sed 可依照脚本的指令来处理、编辑文本文件。

sed语法
sed [addr]X[options]
常用参数

-e 表达式
sed -n '2p' 打印第二行
sed 's#hello#world#' 修改
-i 直接修改源文件
-E 扩展表达式
--debug 调试

pattern

20 30,35 行数与行数范围
/pattern/ 正则匹配
//,//正则匹配的区间

action

d 删除
p 打印,通常结合-n参数
s/原字符串/替换后的字符串/[g] 替换(g替换全部,不加只替换第一个匹配的)
\1 \2 匹配的字段

sed实例

替换字符串(s是固定语法,要以这个开头)

$ echo "helloworld" | sed 's#he#xx#'
xxlloworld

正则表达式和区间选择(-n和p一定要写)

$ echo '1
> 2
> 3
> 4
> 5' | sed -n '/3/,/4/p'
3
4

删除(此时不需要-n)

$ echo '1
2
3
4
5' | sed '/3/,/4/d'
1
2
5

全部替换(15替换为20)

$ ps -ef | sed -e 's/CMD/command/' -e 's#15#20#g'
     UID     PID    PPID  TTY        STIME COMMAND
      HC     823     337 pty0     20:40:27 /usr/bin/ps
      HC     337     336 pty0     20:56:42 /usr/bin/bash
      HC     336       1 ?        20:56:42 /usr/bin/mintty
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,717评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,501评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,311评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,417评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,500评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,538评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,557评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,310评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,759评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,065评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,233评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,909评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,548评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,172评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,420评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,103评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,098评论 2 352

推荐阅读更多精彩内容