麦田的博客

怎么下载整个网站/离线下载器

2019-05-20


本文介绍:怎么下载整个网站、网站离线下载器、扒站工具、网站复制工具

我经常使用并推荐的整站下载软件是WinHTTrack:

1、HTTrack Website Copier,免费软件,有汉化版;

可能遇到的问题:

用HTTracr离线下载一些网站,由于网站robots.txt里面相关的反机器人设置,会导致镜像出错没法离线下载。

错误日志可能提示:

HTTrack检测到当前镜像未储存任何数据…

警告:www.xxx.com/robots.txt永久移动

解决方法1:新建工程,选项–搜寻–URL hacks取消勾选就可以解决

解决方法2:URL结尾没有加/,加上去

下载的文件会自动添加多余的内容:

可以用批量替换软件UltraReplace,点击特征替换,起始特征字符串填:<!– Mirrored

结束特征字符串填:GMT –>

替换内容留空,即可把这些多余内容全部清除。


2、Teleport Pro或者Teleport Ultra,收费软件,有破解汉化;

3、Cyotek WebCopy,免费软件,无汉化版;

使用这款软件,发现不下载css,这几款软件都用过,还是HTTrack最好用!

4、WebZip,不适合我使用;

5、IDM下载整站

当HTTrack下载出错,我用IDM下载整站,体验很好,甚至比HTTrack更好用。

使用方法:任务–运行站点抓取–方案模板选择整个网站…

6、使用Linux的wget命令进行整站离线下载


如果只是保存单页面,浏览器打开后,直接另存为html,保存类型选择:网页,全部

也可以使用Chrome保存mht网页文件。方法是:

在 Chrome 地址栏中键入“chrome://flags”,回车,这是一个 Chrome 的功能配置页面,通过 Ctrl+F 来搜索“mhtml”,找到“将网页另存为 MHTML”这一项,点击Disabled(未启用),更换成Enabled(启用)

然后右击另存为,将默认保存为.mhtml文件。


相关内容

  • 网站监控宕机监控服务器监控
  • CDN详解和自建CDN的方法
  • HTML引入CSS的方法和示例
  • 麦田收集的优秀网站
  • 详解网页段落首行缩进
  • 阅读指南
  • 我的域名投资经验
  • 网站结构经验谈
  • 网站设置301重定向的方法
  • 各类网站备份与还原方法
  • 标签

    下载网站