一个命令行的HTML漂亮的打印机:使凌乱的HTML可读
我正在寻找满足以下要求的HTML漂亮打印机的build议:
- 以HTML作为input,然后输出给定inputHTML的格式良好的/正确缩进但“graphics等同”的版本。
- 必须支持命令行操作。
- 必须是开源的,在Linux下运行。
更新2015: Tidy-html5也应该考虑,因为它支持包括HTML5在内的现代标准。 这是它的GitHub仓库 。
HTML工具的爷爷,支持现代标准。
Tidy是Mac OS X,Linux,Windows,UNIX等的控制台应用程序。 它通过修正标记错误并将旧代码升级到现代标准来纠正和清理HTML和XML文档。
原始回复:
看一下HTML Tidy项目: http : //tidy.sourceforge.net/
整洁阅读HTML,XHTML和XML文件,并写清理标记。 对于HTML变体,它可以检测并纠正许多常见的编码错误,并致力于生成符合W3C标准且在大多数浏览器上可用的视觉等效标记。
为了您的需要,这里是命令行调用Tidy:
tidy -im inputfile.html
Tidy
OS X不支持HTML5
。 但是Github
上有实验分支呢。
为拿到它,为实现它:
brew tap homebrew/dupes brew install tidy --HEAD brew untap homebrew/dupes
而已! 玩的开心!
我认为HTML tidy是这个领域的家喻户晓的名字之一。
对这个问题有一个更新的,操作系统不可知的答案:
虽然最初的 HTMLTidy项目已经蛰伏了6年多 ,但名为“HTML Tidy Advocacy Community Group(HTACG)”的“W3C社区与企业集团”现在已经开始继续其发展, 目标是使其成为完全兼容HTML5 。 该小组于2015年1月成立,尽pipe他们将当前的状态描述为“正在进行中”,但二进制文件已经可供下载。
- 项目主页: http : //www.html-tidy.org/
- W3C组页面: https : //www.w3.org/community/htacg/
- Github存储库: https : //github.com/htacg/tidy-html5
- 二进制下载: http : //www.htacg.org/binaries/
只是OT问题的后续跟进。
像你所期望的一样,Homebrew安装了一个tidy-html5
。
它被联系为tidy5
。