从技术层面来说, 互联网是比较难以理解的事情, 主要是因为它是一个触摸不到的东西. 多数人都从个人角度对它有一个大致的印象, 但对更深入去理解就兴趣缺缺了. 尽官如此,网络还是比较容易被定义的, 并且定义网络有助于我们更好的就解说http这个重要角色.
如果你去创建一个像网络这样的沟通媒介, 假定现有计算机网络(因特网)有三个主要问题需要你去解决,以便于潜在用户使用:
1. 用户该怎样查找内容, 或者说内容提供者怎样确定自己?
2. 用户在这个系统下查找时如何检索内容, 或者说内容提供者如何发送内容?
3. 内容需要以什么样的格式提交才能让所有的用户一致解析?
在网络情境下这三个问题的解答依次是: 通用资源标识符(Universal Resource Identifiers)简称URIs, 超文本传输协议(Hypertext Transfer Protocol)简称HTTP, 和超文本标记语言(Hypertext Markup Language)简称HTML.
很多网络开发人员对这三个技术中的HTML都有了一定的知识积累. 当只需要创建静态内容,比如个人主页时是已经足够了. 然而, 如果需要创建动态内容, 特别是需要构建web应用时,学习HTTP知识就变得非常重要了. 因为在这种情况下,数据和信息比格式化信息方式更加重要.
以银行站点为例, 一个站点用户是更关心储蓄帐户收支呢还是更关心储蓄帐户收支数据有没有以更具美学的方式展示呢? 为了开发出更有用更成功的网站, 把目光聚集在用户对什么更感兴趣就显得非常重要, 在多数情况下的答案是内容.
因为着重于内容和内容的传递, 本书对专业网络开发就这些方面做了细致的介绍.
HTTP简史和用途
为了解HTTP发展历程, 要适当了解我们所熟知的网络是如何开始的. HTTP曾是一个叫做Tim Berners-Lee脑子里的一张巨大图片. 事实上, HTTP就是为了实现网络的想法而设计的.
1989年三月, Berners-Lee 向CERN(欧洲核研究组织)提交了一个倡议书, 定名为:信息管理倡议书. 这个倡议书被大多数发明互联网的代表们支持. 虽然这个倡议书只是做了大至的概括而没有具体实施细节,但它确实对这个改变世界远景的发明定义了关键概念. Berners-Lee在1991年8月就万维网在新闻组做了宣言. 现在还能在谷歌组织查找到这个宣言原文: http://groups.google.com/groups?selm=6487%40cernvax.cern.chhttp://groups.google.com/groups?selm=6487%40cernvax.cern.ch
下面是关于网络的里程碑事件及时间点:
1989年3月------ Tim Berners-Lee写下信息管理倡议书.
1991年8月------ Tim Berners-Lee就万维网做出宣言.
1993年3月------ Marc Andreesen 发布NCSA Mosaic 0.10 (网络浏览器), 它支持<img>标签, 书签以及在X下更友好的图表接口支持.
1993年9月------ NCSA 为X\Macintosh\PC适配Mosaic.
1994年3月------Marc Ajndreesen和其同事们离开NCSA, 创立了Mosaic Communications Corporation(即后面的Netscape).
1994年6月------ Brian Pinkerton发布 WebCrawler, 一个网络索引.
1994年8月------ Jeff Bezos 为亚马逊招兵买马.
1994年10月------ Marc Andreesen发布Mosaic Netscape 0.9 Beta.
1994年10月------ Tim Berners-Lee创立万维网委员会(W3C).
1994年11月------ W3C第一个会议在MIT举行.
1995年9月------ eBay创办广告拍卖服务.
1998年3月------ 谷歌成立.
你可以疑惑HTTP是如何适应网络在这么些年来的快速发展的, 因为最开始它只是一个允许定位及检索内容的非常简单的协议, 是远远不能满足现今商业应用的类型需求的. 跟工业进化一样, HTTP也在不断演进.
HTTP 0.9
第一版的HTTP极其基础(简陋). 它允许网络客户端用GET方式请求内容, 没有HTTP 请求头(header), 也没有HTTP版本号. 请求里就只有一行字: GET/index.html
因为在HTTP 0.9版里没有请求头,所以它只支持一种类型的内容,那就是纯文本. 当然, 文档依然可以用HTML格式, 但它没有媒体类型用以支持使用图片及其它类型的内容. 当然可以说这个版本非常之基础, 但也完成了预期目的.
http 0.9事务中的基本系列事件由正在建立的tcp连接组成, 一个像上面例子中的请求发送以后, 内容将被返回(如果内容存在). 其中也没有提及到错误码的情况, 如果内容不存在则没有内容返回, TCP连接在内容返回后关闭(如果有内容返回的话).
尽管后续版本都要求向前兼容, 但大多数现代网络客户端和服务器仅能够与HTTP 1.0以上的版本通信.
HTTP 1.0
由于HTTP 1.0 在网络出现的早期就已经推出(RFC可以追溯到1996年), 很多人从没在http 0.9 的约束下使用网络. 我最早对网络的记忆是使用Lynx 网络浏览器浏览内容, 它不支持图形交互界面, 图片以及使用鼠标浏览.当HTTP大规模采用时, 这个阶段发展迅猛, 网络的潜力开始清晰起来.
HTTP 1.0最令人瞩目的区别在于, 至少对于用户来说,网络已经有能力以HTML表单的形式向用户发回数据. 这个要归功于POST方法的加入,我将在第二章的HTTP定义中讲解.