什么是URI
URI即统一资源标示符(Uniform Resource Identifier),URI用于标识网络上某个特定的资源。URI的重点是在于标识资源,它其实是一个抽象定义,无论用什么方式来实现,只要可以唯一标识一个资源,都可以叫做URI。URI最典型的两种实现方式是URL(统一资源定位符,Uniform Resource Locator)和URN(即统一资源名称,Uniform Resource Name)。URL通过资源的地址来标识一个资源,而URN则通过资源的名称来标识一个资源。
URI和URL的区别
在开发过程中,经常会混淆两个名词:URI和URL,那么URI和URL之间的 关系是什么呢?首先来看下URL的定义。
-
什么是URL
URL即统一资源定位符(Uniform Resource Locator),用于标识网络上一个资源的地址,通过URL,我们可以在网络上唯一定位到某个资源(一个网页,或者是一张图片等)。URL像是资源的门牌号,通过这个门牌号,我们可以找到特定的资源。
所以,URL其实是URI的一个子集,是URI的一种实现形式。也就是说,URL一定是URI,反过来说URI则不一定是URL,因为URI还可能是URN。
URI格式
URL的基本形式如下:
[scheme:]scheme-specific-part[#fragment]
其中:
scheme:以":"为结尾(不包含":"),表示协议名,例如http,https,ftp等。
fragment:表示片段,在URI中以"#"开头(不包含"#")。一个网页资源可能会分为不同的片段,例如想访问网页后直接到达指定位置,可以通过fragment来实现。
scheme-specific-part:协议和片段之间的部分(":"之后,"#"之前),这部分会根据scheme的不同而变化。
将scheme-specific-part
部分进一步扩展,形式如下
[scheme:][//authority][path][?query][#fragment]
其中:
authority:以"//"开头(不包含"//"),表示URI的授权机构,authority=host:port
path:以"/"开头(包含"/"),表示资源的路径,一个资源可以有多级path,每个path之间通过"/"连接 。
query:以"?"开头(不包含"?"),以key=value形式表示的参数集合,多个query参数之间,通过&连接。
将authority
部分进一步划分,形式如下
[scheme:][//host:port][path][?query][#fragment]
其中:
host:表示主机名或者域名。
port:表示端口号,端口号可以省略。
在android中,URI的scheme和authority部分是必须的,其他部分是可省略的。例如以下形式在android中都是合法的。
- scheme://authority
- scheme://authoriry?key1=value1&key2=value2
- scheme://authoriry?key1=value1&key2=value2#fragment
- scheme://authoriry/path1/path2
- scheme://authoriry/path1/path2#fragment
举个栗子,有如下URI
https://www.baidu.com:8080/path1/readme.html?user=xmh&id=1#test
通过解析可以得到各部分的值如下所示。
-
scheme:
https
。 -
scheme-specific-part:":"后面到"#"中间的所有部分,即
//www.baidu.com:8080/path1/readme.html?user=xmh&id=1
-
fragment:"#"后面的部分,即
test
-
authority:"//"之后,path("/")之前的部分,即
www.baidu.com:8080
-
host:
www.baidu.com
-
port:
8080
-
path:authority之后,query("?")之前的部分,注意path包含开头的"/",即
/path1/readme.html
-
query:"?"后面,fragment("#")前面的部分,即
user=xmh&id=1
其他概念
绝对URI:以scheme起始的完整URI,如https://www.baidu.com。
相对URI:没有scheme非完整URI,如www.baidu.com。
不透明URI:scheme-specific-part部分不是以"/"起始的,如mailto: test@qq.com。
分层URI:scheme-specific-part组件是以"/"起始的,如http://www.baidu.com。