关于URL
说起URL,大家第一反应可能是这不就是一个地址吗,还能有什么门道?
URL是Uniform Resource Locator的缩写,称为统一资源定位符。URL正是使用web浏览器访问web页面时需要输入的网页地址。URL是一种强有力的工具。但URL并不完美。它表示的是实际的地址,而不是准确的名字。这种方案的缺点在于如果资源被移走了,URL也就不再有效了。那么它就无法对对象进行定位了 。
URL的构成
一个标准的URL语法组成是下面这样的:
scheme://login:password@address:port/path_to_resource?query_string#fragment
简化下上面的组成,就可以把URL分成下面四部分:
传输协议 + 域名或IP地址 + [端口(端口为80时可省略)] + 资源路径 + 查询字符串
如果要指定访问端口时需要用“:”来隔开,例如(http://www.baidu.com:80/index.php)
1、传输协议
协议名称是由一串不区分大小写的字母组成,以 : 作为结束符。协议所表示的是获取该资源需要使用的协议。如HTTP、HTTPS等。常见的协议有:
http
http是一种超文本传输协议,除了没有用户名和密码之外,与通用的URL格式相符。如果省略了端口,就默认为80。
基本格式:http://<host>:<port>/<path>?<query>#<frag>
示例:http://www.baidu.com/index.html或http://www.baidu.com:80/index.html
https
https与http是一对,唯一的区别在于https在http的基础上加上了SSL, SSL为http连接提供了端到端的加密机制。其语法与http的语法相同,默认端口为443。
基本格式:https://<host>:<port>/<path>?<query>#<frag>
示例:https://kyfw.12306.cn/otn/leftTicket/init
mailto
mailto URL指向的是E-mail地址,由于E-mail的行为与其他方案都有所不同(它并不指向任何可以直接访问的对象),所以mailto URL的格式与标准URL的格式也有所不同。
ftp
ftp协议是文件传输协议,通过该协议的URL可以从FTP服务器上下载或向其上传文件,并获取FTP服务器上的目录结构内容的列表。
基本格式:ftp://<user>:<password>@<host>:<port>/<path>;<params>
示例:ftp://root:test2017@tsinghua.edu:21/pub/gnu/
鉴于主题和篇幅关系,其他的协议就不一一介绍了,有兴趣可以额外搜索了解。
2、主机和端口
要想在互联网上找到资源,应用程序要知道是哪台机器装载了资源,以及在那台机器的什么地方可以找到能对目标资源进行访问的服务器,URL的主机和端口组件提供了这两组信息。
主机标识了互联网上能够访问资源的宿主机器。可以用上述域名(www.baidu.com)或者IP地址(14.215.177.38)来表示主机名。
端口组件标识了服务器正在监听的网络端口,对下层使用了TCP协议的HTTP来说,默认端口号就是80。
3、资源路径
URL的资源路径说明了需要访问的资源位于服务器的什么地方,路径通常就像一个分级的文件系统路径。
示例:https://github.com/AlanYangs/Log4Reports/blob/master/pom.xml
这个URL中的路径为/AlanYangs/Log4Reports/blob/master/pom.xml,很像UNIX文件系统中的文件系统路径。路径是服务器定位资源时所需的信息,可以用字符“/”将HTTP URL的路径组件划分成一些路径段(path segment)。
4、查询字符串
很多资源,比如数据库服务,都是可以通过査询来缩小所请求资源类型范围的。假设数据库中维护着一个未售货物的清单,并可以对淸单进行査询,以判断产品是否有货,那就可以用下列URL来査询Web数据库网关,看看id为12731、颜色为blue、尺寸为large的条目是否有货:
http://www.test.com/query?id=12731&color=blue&size=large
分析下上面的URL,发现问号(?)右边的内容是前面没有出现的,这部分可以称为查询(query)组件,通常是以键值对的形式出现,多个键值对之间用&连接。此外,对于查询字符串除了有些不合规则的字符(比如空格等)还需要转码处理。
HTTP的请求的方式
这一部分从内容上看貌似应该放在上一篇《关于HTTP》中说明的,放在URL中来说明是为了更好的理解GET和POST方式的区别。HTTP的请求的方式有多种,打开一个HTTP接口工具(PostMan),可以查看下请求的类型:
postman
请求类型有这么多,我们通常只需要关注GET和POST就好,下面具体介绍下GET和POST方法的URL样式及对比。
1、URL样式
GET - 通常是从指定的服务器中获取数据,查询字符串(键值对)被附加在URL地址后面一起发送到服务器,如下面这样的:http://localhost:8090/api/query?id=3,在postman中的请求示例如下:
POST - 通常是提交数据给指定的服务器处理,当然也可以从服务器获取数据。使用POST方法时,查询字符串或发送的数据在POST信息中单独存在,和请求URL一起发送到服务器,而不是像GET方法一样直接放在URL中。在postman中的请求示例如下:
2、GET和POST的区别
从上面的例子我们可以看到,GET请求消息体(body)为空,POST请求带有消息体(请区分请求body和响应body)。
GET提交的数据会放在URL之后,以?分割URL和传输数据,参数之间以&相连,如query?name=test1&id=123456。-
POST方法是把提交的数据放在HTTP包的请求body中。
GET提交的数据大小有限制(因为浏览器对URL的长度有限制),而POST方法提交的数据没有限制。
GET方式提交数据,会带来安全问题,比如一个登录页面,通过GET方式提交数据时,用户名和密码将出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获得该用户的账号和密码。
关于工具
“工欲善其事,必先利其器”,目前比较流行的HTTP接口工具有postman(可以单独安装也可以作为Chrome的插件安装)、HttpRequest(火狐上的插件),或者自己写个html的form表单提交也是可以的。