cut:从文本中提取一段文字并输出
cut命令从文件的每一行剪切字节、字符或字段,并将这些字节、字符或字段输出至标准输出。
参数选项 | 解释说明 |
---|---|
-b | 以字节为单位进行分割 |
-n | 取消分割多字节字符,与-b选项连用 |
-c | 以字符为单位进行分割 |
-d | 自定义分隔符,默认以tab为分隔符 |
-f | 与选项-d连用,指定显示区域 |
N | 第N个字节、字符或字段 |
N- | 从第N个字节、字符或字段开始直至行尾 |
N-M | 从第N到第M(包含M)个字节、字符或字段 |
-M | 从第一个到第M(包含M)个字节、字符或字段 |
cut -c 2-10 test.txt
cut -nb 2-10 test.txt
cut -d : -f 1 /etc/passwd
root
bin
daemon
cut -d : -f 3-5 /etc/passwd # 显示第三列到第五列
split:可以按照指定的行数或者指定的文件大小分割文件。
参数 | 解释 |
---|---|
-b | 指定分割后文件的最大字节数 |
-l | 指定分割后文件的最大行数 |
-a | 指定后缀长度,默认为2位字母 |
-d | 使用数字后缀 |
split -l 10 a.txt newa #每10行分割一次,分割的文件名以newa开头
split -l 10 -a 3 a.txt new_ #参数-a指定后缀的长度
new-aaa
new-aab
new-aac
split -b 500k -d a.txt newa_ #按文件大小分割文件,500k一个,使用数字后缀。
paste:将文件按照行与行进行合并,中间使用tab隔开
语法格式:
paste [option] [file]
说明: 如果file是“-”,表示从标准输入读取内容
参数选项:
-d: 指定合并的分隔符,默认是tab
-s: 每个文件占用一行
sort:将输入的文件内容按照指定的规则进行排序,然后将排序结果输出。
参数 | 说明 |
---|---|
-b | 忽略每行开头存在的空格 |
-n | 依照数值的大小进行排序 |
-r | 倒序排列 |
-u | 去除重复行 |
-t | 指定分割符 |
-k | 按指定区间排序 |
sort -n -t. -k3,3 -k4.1,4.3 a.txt
###
-n:按照数字排序
-t:按“.”作为分隔符
-k3,3:从第3个字段开始到第3个字段结束排序
-k4.1,4.3:从第4个字段第1个字符开始到第4个字段第3个字符结束排序
.号连接的是字符
,连接的是字段
uniq:去除重复行
参数 | 说明 |
---|---|
-c | 去除重复行,并计算每行出现的次数 |
-d | 只显示重复的行 |
-u | 只显示唯一的行 |
wc:统计文件的行数,单词数或字节数
参数 | 说明 |
---|---|
-c | 统计字节数 |
-w | 统计单词数 |
-m | 统计字符数 |
-l | 统计行数 |
-L | 打印最长行的长度 |
评论