删除包含特定string的文本文件中的行
我将如何使用sed删除包含特定string的文本文件中的整行?
要删除行并将输出打印到标准输出:
sed '/pattern to match/d' ./infile
要直接修改文件:
sed -i '/pattern to match/d' ./infile
要直接修改文件(并创build一个备份):
sed -i.bak '/pattern to match/d' ./infile
对于Mac OS X用户:
sed -i '' '/pattern/d' ./infile
还有很多其他方法可以删除sed
以外的特定string
AWK
awk '!/pattern/' file > temp && mv temp file
ruby(1.9+)
ruby -i.bak -ne 'print if not /test/' file
Perl的
perl -ni.bak -e "print unless /pattern/" file
壳(bash3.2 +)
while read -r line do [[ ! $s =~ pattern ]] && echo "$line" done <file > o mv o file
GNU grep
grep -v "pattern" file > temp && mv temp file
当然sed
(打印反向比实际删除更快)。
sed -n '/pattern/!p' file
您可以使用sed来replace文件中的行。 但是,它似乎比使用grep反转第二个文件,然后将第二个文件移动到原来的要慢得多。
例如
sed -i '/pattern/d' filename
要么
grep -v "pattern" filename > filename2; mv filename2 filename
无论如何,我的机器上第一个命令需要3倍的时间。
简单的方法来做到这一点:
sed --in-place '/some string here/d' yourfile
你可以考虑使用ex
(这是一个标准的基于UNIX命令的编辑器):
ex +g/match/d -cwq file
哪里:
-
+
执行给定的Ex命令(man ex
),与执行wq
(写入和退出)的-c
相同, -
g/match/d
– 用于删除给定match
行的Ex命令,请参阅: g的功率
上面的例子是POSIX兼容的方法,用于在Unix.SE和POSIX规范中就地编辑文件。
与sed
的区别在于:
sed
是一个文件编辑器,不是文件编辑器。 BashFAQ
除非你喜欢不可移植的代码,I / O开销和一些其他不良的副作用。 所以基本上一些参数(如in-place / -i
)是非标准的FreeBSD扩展,可能在其他操作系统上不可用。
我在Mac上苦苦挣扎。 另外,我需要使用variablesreplace。 所以我用:
sed -i '' "/$pattern/d" $file
其中$file
是需要删除的文件, $pattern
是要删除的模式。 从这个评论中挑选出来的。 这里要注意的是在"/$pattern/d"
使用双引号 。 当我们使用单引号时,variables将不起作用。
要像grep
那样得到一个像结果一样的地方,你可以这样做:
echo "$(grep -v "pattern" filename)" >filename
你也可以使用这个
grep -v 'pattern' filename
这里-v将打印只有你的模式(这意味着反转匹配)
我用一个包含大约345000行的文件做了一个小基准。 在这种情况下,使用grep
的方式似乎比sed
方法快了15倍。
我已经尝试了和没有设置LC_ALL = C,似乎并没有显着改变时间。 searchstring(CDGA_00004.pdbqt.gz.tar)位于文件中间的某个位置。
这里是命令和时间:
time sed -i "/CDGA_00004.pdbqt.gz.tar/d" /tmp/input.txt real 0m0.711s user 0m0.179s sys 0m0.530s time perl -ni -e 'print unless /CDGA_00004.pdbqt.gz.tar/' /tmp/input.txt real 0m0.105s user 0m0.088s sys 0m0.016s time (grep -v CDGA_00004.pdbqt.gz.tar /tmp/input.txt > /tmp/input.tmp; mv /tmp/input.tmp /tmp/input.txt ) real 0m0.046s user 0m0.014s sys 0m0.019s
SED:
-
'/James\|John/d'
-
-n '/James\|John/!p'
AWK:
-
'!/James|John/'
-
/James|John/ {next;} {print}
GREP:
-
-v 'James\|John'
perl -i -nle'/regexp/||print' file1 file2 file3 perl -i.bk -nle'/regexp/||print' file1 file2 file3
echo -e "/thing_to_delete\ndd\033:x\n" | vim file_to_edit.txt
以防万一有人想要完成匹配的string,可以使用-w在grep中标记,w在整个中。 也就是说,例如,如果要删除具有编号11的行,但保留编号为111的行:
-bash-4.1$ head file 1 11 111 -bash-4.1$ grep -v "11" file 1 -bash-4.1$ grep -w -v "11" file 1 111
如果你想一次排除几个确切的模式,也可以使用-f标志。 如果“黑名单”是要从“文件”中删除的每行上有多个模式的文件:
grep -w -v -f blacklist file