文件中最长的行

我正在寻找一种简单的方法来查找文件中最长行的长度。 理想情况下,这将是一个简单的bash shell命令而不是脚本。

使用wc(GNU coreutils)7.4:

wc -L filename 

得到:

 101 filename 
 cat filename|awk '{print length, $0}'|sort -nr|head -1 

供参考: 查找文件中最长的行

 awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }' YOURFILE 

仅仅为了娱乐和教育的目的, 纯粹的POSIX shell解决scheme ,没有无用的使用猫,也没有分叉到外部命令。 以文件名作为第一个参数:

 #!/bin/sh MAX=0 IFS= while read -r line; do if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi done < "$1" printf "$MAX\n" 
 wc -L < filename 

 101 
 perl -ne 'print length()." line $. $_"' myfile | sort -nr | head -n 1 

打印最长行的长度,行号和内容

 perl -ne 'print length()." line $. $_"' myfile | sort -n 

打印所有行的sorting列表,包括行号和长度

. 是连接运算符 – 它在length()之后使用
$. 是当前行号
$_是当前行

上述例子中重要的忽视点。

以下两个示例计算扩展标签

  wc -L <"${SourceFile}" # or expand --tabs=1 "${SourceFile}" | awk '{ if (length($0) > max) {max = length($0)} } END { print max }' 

以下2个计数未展开标签。

  expand --tabs=1 "${SourceFile}" | wc -L # or awk '{ if (length($0) > max) {max = length($0)} } END { print max }' "${SourceFile}" 

所以

  Expanded nonexpanded $'nn\tnn' 10 5 

在perl中:

 perl -ne 'print ($l = $_) if (length > length($l));' filename | tail -1 

这只打印线,不是它的长度。

这里是anwser的参考

 cat filename | awk '{print length, $0}'|sort -nr|head -1 

http://wtanaka.com/node/7719

只是为了好玩,这里是Powershell版本:

 cat filename.txt | sort length | select -last 1 

而只是得到长度:

 (cat filename.txt | sort length | select -last 1).Length 

看起来所有的答案不要给最长的行的行号。 以下命令可以给出行号和粗略的长度:

 $ cat -n test.txt | awk '{print "longest_line_number: " $1 " length_with_line_number: " length}' | sort -k4 -nr | head -3 longest_line_number: 3 length_with_line_number: 13 longest_line_number: 4 length_with_line_number: 12 longest_line_number: 2 length_with_line_number: 11 

主题的变化。

这将显示文件中find的最长行的长度的所有行,保留它们在源文件中出现的顺序。

 FILE=myfile grep `tr -c "\n" "." < $FILE | sort | tail -1` $FILE 

所以myfile

 x mn xyz 123 abc 

会给

 xyz 123 abc 

我在Unix环境中,并使用几GB的gzip文件。 我使用一个logging长度为2052的2 GB压缩文件testing了以下命令。

  1. zcat <gzipped file> | wc -L

  1. zcat <gzipped file> | awk '{print length}' | sort -u

时代正在平息

  1. 117秒

  2. 109秒

这是我的脚本大约10次运行后。

 START=$(date +%s) ## time of start zcat $1 | wc -L END=$(date +%s) ## time of end DIFF=$(( $END - $START )) echo "It took $DIFF seconds" START=$(date +%s) ## time of start zcat $1 | awk '{print length}' | sort -u END=$(date +%s) ## time of end DIFF=$(( $END - $START )) echo "It took $DIFF seconds"