情景linux--如何得出一个文件的第二列？

情景

曾经有一同事问我，在linux下如何输出一个文本文件的第二列，文本内容不限。我不假思索地说用awk啊。她追问只有这一种方式么？于是我仔细想了想，……

既然内容不限，则可以自定义文件内容的格式，这样可以用的命令自然会多一些。

需求为输出文件第二列，则基本上有两种方式实现：

因而，任何能直接输出特定列的命令，以及能够截取或删除其它列的命令都满足此需求。

为了方便说明，列举几个示例文件：

cat test1.txt

1 zhangsan 15 hebei
2 lisi 17 jiangsu
3 wangwu 29 tianjin
4 zhaoliu 21 fujian

cat test2.txt

1:test001:15:hebei
2:test002:17:jiangsu
3:test003:29:tianjin
4:test004:21:fujian

awk自然是最容易想到的，它处理格式化的文本得心应手。

awk '{print $2}' test1.txt

zhangsan
lisi
wangwu
zhaoliu

使用-F指定列（字段）分隔符。

awk -F ":" '{print $2}' test2.txt

test001
test002
test003
test004

如果文件只有两列，还可以使用$NF，如awk '{print $NF}' test1.txt。

awk还支持一些函数，同样可以将第二列提取出来，此处不再赘述。

cut命令的默认字段分隔符是TAB，可以使用-d重新指定。 -f列出指定字段。

cut -d " " -f 2 test1.txt

zhangsan
lisi
wangwu
zhaoliu

cut -d ":" -f 2 test2.txt

test001
test002
test003
test004

如果第二列的字符的起始和结束序号为固定值，如test2.txt，可以使用-c参数，截取特定的字符序列。

cut -c 3-9 test2.txt

test001
test002
test003
test004

sed采用的是第二种实现方式，即将其它列删除掉，利用后向引用：

sed "s/^[^ ]* \([^ ]*\) [^ ]* [^ ]*/\1/g" test1.txt

zhangsan
lisi
wangwu
zhaoliu

sed "s/^[^:]*:\([^:]*\):[^:]*:[^:]*/\1/g" test2.txt

test001
test002
test003
test004

在test1.txt中，第二列的前面和后面分别为数字空格和空格数字，所以可以利用正则表达式将其输出出来。

grep -oP "(?<=[0-9] )[^ ]+(?= [0-9])" test1.txt

zhangsan
lisi
wangwu
zhaoliu

同理：

grep -oP "(?<=[0-9]:)[^:]+(?=:[0-9])" test2.txt

test001
test002
test003
test004

colrm命令可以删除标准输入中的指定列，但该命令中所定义的列指的是单个字符，这与常规对字段的定义不同，需注意。
格式如下：

colrm [start [stop]]

如果只指定start，则大于等于start的列均被删除；如果指定了start和stop，则大于等于start，小于等于stop的列被删除。

因此，此命令可处理第二个字段起始位置为固定值的test2.txt文件。

cat test2.txt | colrm 1 2 | colrm 8

test001
test002
test003
test004

read读取文件中的每行，将特定的列输出来。

while read a b c d ;do echo $b;done < test1.txt

zhangsan
lisi
wangwu
zhaoliu

IFS=":";while read a b c d ;do echo $b;done < test2.txt

test001
test002
test003
test004

shell支持命令替换，通过两次命令替换，得到第二列：

while read line;do temp1=${line#* };temp2=${temp1%% *};echo $temp2; done < test1.txt

zhangsan
lisi
wangwu
zhaoliu

while read line;do temp1=${line#*:};temp2=${temp1%%:*};echo $temp2; done < test2.txt

test001
test002
test003
test004

虽然不清楚她从哪里看到的这道题目，题目本身是何用意。但以一个问题，调动起了对linux多个命令及知识点的学习和总结，还是有价值的。

欢迎提出不同解法！