一、URL、URI和URN三者之间的区别
起源
这三个缩略词是Tim Berners-Lee在一篇名为RFC 3986: Uniform Resource Identifier (URI): Generic Syntax的文档中定义的互联网标准追踪协议。
统一资源标识符(URI)提供了一个简单、可扩展的资源标识方式。URI规范中的语义和语法来源于万维网全球信息主动引入的概念,万维网从1990年起使用这种标识符数据,并被描述为“万维网中的统一资源描述符”。
区别
首先我们要弄清楚一件事**:URL和URN都是URI的子集**。
换言之,URL和URN都是URI,但是URI不一定是URL或者URN。为了更好的理解这个概念,看下面这张图片。
通过下面的例子(源自 Wikipedia),我们可以很好地理解URN 和 URL之间的区别。如果是一个人,我们会想到他的姓名和住址。
URL类似于住址,它告诉你一种寻找目标的方式(在这个例子中,是通过街道地址找到一个人)。要知道,上述定义同时也是一个URI。
相对地,我们可以把一个人的名字看作是URN;因此可以用URN来唯一标识一个实体。由于可能存在同名(姓氏也相同)的情况,所以更准确地说,人名这个例子并不是十分恰当。更为恰当的是书籍的ISBN码和产品在系统内的序列号,尽管没有告诉你用什么方式或者到什么地方去找到目标,但是你有足够的信息来检索到它。
关于URL:
URL是URI的一种,不仅标识了Web 资源,还指定了操作或者获取方式,同时指出了主要访问机制和网络位置。
关于URN:
URN是URI的一种,用特定命名空间的名字标识资源。使用URN可以在不知道其网络位置及访问方式的情况下讨论资源。
这是一个URI:http://bitpoetry.io/posts/hello.html#intro
我们开始分析
http://: 是定义如何访问资源的方式。
bitpoetry.io/posts/hello.html:是资源存放的位置
#intro:资源
*URL*是URI的一个子集,告诉我们访问网络位置的方式。在我们的例子中,URL应该如下所示:http://bitpoetry.io/posts/hello.html
*URN*是URI的子集,包括名字(给定的命名空间内),但是不包括访问方式,如下所示:bitpoetry.io/posts/hello.html#intro
就是这样。现在你应该能够辨别出URL和URN之间的不同。
如果你忘记了这篇文章的内容,至少要记住一件事:URI可以被分为URL、URN或两者的组合。如果你一直使用URI这个术语,就不会有错
二、url规范
模式规范
强制:统一采用小写,并以中划线(-)作为分隔符,不得 进行驼峰式的大小写混合,不得 采用其它分割符。
比如:http://www.example.com/green-dress.html
URL 的生成与拼接
建议: 采用 UriComponent 相关的组件,而非字符串拼接,可以避免较多的不规范及编码问题,如下所示:
UriComponents uriComponents = UriComponentsBuilder.fromUriString("http://www.example.com/query") .queryParam("fromUserCode", config.getVmsFromUserCode()) .queryParam("toUserCode", account) .queryParam("msgText", content); log.info("URL:{}", uriComponents.toUriString());