下载网页和依赖关系,包括CSS图像
通常我需要下载一个网页,然后离线编辑。 我已经尝试了几个工具,他们缺乏的主要function是下载CSS文件中引用的图像。
有没有一个工具(Linux),将下载的一切,使网页将呈现相同的脱机(不包括AJAX)?
wget --page-requisites http://example.com/your/page.html
该选项使Wget下载正确显示给定html页面所需的所有文件。 这包括内联图像,声音和引用的样式表等内容。
编辑:meder是正确的:股票wget不parsing和下载css图像。 不过,有一个补丁增加了这个function:[ 1,2 ]
更新:上面提到的补丁已经合并到wget 1.12 ,发布2009年9月22日:
** Added support for CSS. This includes: - Parsing links from CSS files, and from CSS content found in HTML style tags and attributes. - Supporting conversion of links found within CSS content, when --convert-links is specified. - Ensuring that CSS files end in the ".css" filename extension, when --convert-links is specified.
有可能通过Firefox做到这一点,看看这个表格
- 右键点击
- 查看页面信息
- select媒体选项卡
- 突出显示所有文件
- 另存为
参考 – http://www.webdeveloper.com/forum/showthread.php?t=212610
wget是您的绝佳select。 只是想了解更多的信息,目前windows上的wget版本没有官方发布的gnu for wget版本1.12。 目前的版本是1.11
wget版本1.11不能在css文件中下载图片/字体。 幸运的是,你可以从这个页面find1.14版本。 它解决了这些问题。
http://opensourcepack.blogspot.com/2010/05/wget-112-for-windows.html
有一天,我为客户工作遇到了同样的问题。 另一个工作得很好的工具是HTTrack 。 这个软件可以在Windows和Linux的命令行版本中使用。 对于Linux,他们为大多数常见操作系统预置了软件包
对于我的目的,它比wget更好的一些附加function/开关修复HTML文件中的链接。
Opera(12)的当前版本允许将页面保存为“带图像的HTML”。
从而Opera还下载CSS文件中引用的图像,并相应地调整CSS中的图像URL。
在Firefox中:
文件 – >保存页面 – >网页,完成
保存所有的JavaScript和图像和CSS。 没有别的要求:)
wget