最近工作中需要下载ftp服务器上的文件,本来是想写脚本的,后来发现wget命令的强大之处,在此进行记录。
1. wget
wget:名字是“World Wide Web”和“Get”的结合,目前支持通过HTTP、HTTPS,以及FTP这三个最常见的TCP/IP协议下载
2. 参数
-h : --help, 显示帮助信息
- -c : --continue 断点续传
--progress=TYPE : 选择进度条类型 - -t: --tries=NUMBER 设置重复次数(0 代表无限制)
--retry-connrefused : 即使拒绝连接也重试 - -r : 递归下载服务器上所有的目录和文件,实质就是下载整个网站
- -l : --level=NUMBER, 递归最大深度, 如只下载两层 -l 2
- -N : 只下载比本地新的文件
- -nc : --no-clobber 不要覆盖已经存在的文件
- -k : --convert-links 让下载得到的 HTML 或 CSS 中的链接指向本地文件。
- -K : --backup-converted 在转换文件 X 前先将它备份为 X.orig。
- -m : --mirror -N -r -l inf --no-remove-listing 的缩写形式。
- -p : --page-requisites 下载所有用于显示 HTML 页面的图片之类的元素。
--strict-comments 开启 HTML 注释的精确处理(SGML)。 - -A : --accept=LIST, 指定可接受的扩展名列表,逗号分隔,如 -A .gz,.xml
- -R : --reject=LIST, 指定要拒绝的扩展名列表,逗号分隔
- -D : –domains=LIST : 可以接受的域名,逗号分隔
--exclude-domains=LIST : 拒绝的域名,逗号分隔 - -L : –relative 下载关联链接
-follow-ftp 只下载FTP链接 - -H: –span-hosts, 可以下载外面的主机
- -I : –include-directories=LIST, 允许的目录
- -X : –exclude-directories=LIST, 拒绝的目录
- --ftp-user='user' : 设置 ftp 用户名为 user
- --ftp-password='123' : 设置 ftp 密码为 123
- --no-remove-listing : 不要删除‘.listing’文件。
- --no-glob : 不在 FTP 文件名中使用通配符展开。
- --no-passive-ftp : 禁用“passive”传输模式。
- --retr-symlinks : 递归目录时,获取链接的文件(而非目录)
- -http-user=USER : 设置HTTP用户
- -http-passwd=PASS : 设置HTTP密码
- -proxy-user=USER : 设置代理用户
- -proxy-passwd=PASS : 设置代理密码
3. 个人使用到的
wget ftp://xxxx --ftp-user='anonymous' --ftp-password='' -r -c -N --accept=.pdf
匿名用户登录ftp服务器,user:'anonymous', password:''