一个命令行的HTML漂亮的打印机:使凌乱的HTML可读

我正在寻找满足以下要求的HTML漂亮打印机的build议:

  • 以HTML作为input,然后输出给定inputHTML的格式良好的/正确缩进但“graphics等同”的版本。
  • 必须支持命令行操作。
  • 必须是开源的,在Linux下运行。

更新2015: Tidy-html5也应该考虑,因为它支持包括HTML5在内的现代标准。 这是它的GitHub仓库 。

HTML工具的爷爷,支持现代标准。

Tidy是Mac OS X,Linux,Windows,UNIX等的控制台应用程序。 它通过修正标记错误并将旧代码升级到现代标准来纠正和清理HTML和XML文档。


原始回复:

看一下HTML Tidy项目: http : //tidy.sourceforge.net/

整洁阅读HTML,XHTML和XML文件,并写清理标记。 对于HTML变体,它可以检测并纠正许多常见的编码错误,并致力于生成符合W3C标准且在大多数浏览器上可用的视觉等效标记。

为了您的需要,这里是命令行调用Tidy:

 tidy -im inputfile.html 

Tidy OS X不支持HTML5 。 但是Github上有实验分支呢。

为拿到它,为实现它:

  brew tap homebrew/dupes brew install tidy --HEAD brew untap homebrew/dupes 

而已! 玩的开心!

我认为HTML tidy是这个领域的家喻户晓的名字之一。

对这个问题有一个更新的,操作系统不可知的答案:

虽然最初的 HTMLTidy项目已经蛰伏了6年多 ,但名为“HTML Tidy Advocacy Community Group(HTACG)”的“W3C社区与企业集团”现在已经开始继续其发展, 目标是使其成为完全兼容HTML5 。 该小组于2015年1月成立,尽pipe他们将当前的状态描述为“正在进行中”,但二进制文件已经可供下载。

  • 项目主页: http : //www.html-tidy.org/
  • W3C组页面: https : //www.w3.org/community/htacg/
  • Github存储库: https : //github.com/htacg/tidy-html5
  • 二进制下载: http : //www.htacg.org/binaries/

只是OT问题的后续跟进。

像你所期望的一样,Homebrew安装了一个tidy-html5

它被联系为tidy5

Interesting Posts