一、浏览因特网资源
一个人将浏览器指向一个URL,浏览器会幕后发送适当的协议报文来获取人们所期望的资源。HTTP规范中使用URL(URI的子集)来作为资源唯一定位符。URL分为三个部分:
1、Scheme:方案可以告知Web客户端怎样访问资源;
2、服务器的位置:告知Web客户端资源位于何处;
3、资源路径:说明了请求的是哪个特定的本地资源。
二、URL语法
大多数URL方案的url语法都建立在以下九个部分的通用格式上:
<scheme>://<user>:<password>@<host>:<port></><path>;<parama>?<query>#<flag>
其中第一节提到的三个部分为最重要部分。
方案——使用什么协议。
主机及端口——标识能够访问资源的宿主机器和服务器正在监听的网络端口。
用户名和密码——需要有权限才能正常访问数据,中间用:隔开。
路径——指明资源位于服务器的什么地方,通常像一个分级的文件系统路径。
参数——提供访问资源所需的所有附加信息。
查询字符串——通过提问题或进行查询来缩小所请求资源类型的范围。
片段——引用部分资源或者资源的某个片段。
三、URL快捷方式
1、相对URL
URL分为绝对URL和相对URL。绝对URL包含了所有访问资源所需的全部信息。相对URL是不完整的,如果要使用相对URL来解析资源,那么,就需要另外一个被称为base的URL。
2、Base URL
基础URL是作为相对URL的参考点使用的。其来源不同:在资源中显示提供基础URL;封装资源的基础URL;有时候没有基础URL。不管那种情况下的相对URL都会转换呈绝对的URL。
3、自动拓展URL
有些浏览器会在用户提交URL后自动扩展URL,主要分为主机名扩展和历史扩展。
主机名扩展:某些网站的主机地址不需要完全填写,也可访问,就是因为浏览器可以为我们自动扩展。
历史扩展:用户以前使用过的URL,可以被浏览器作为备选URL,来扩展或者说填充到URL中。
四、各种头疼的字符
URL字符集可以将不安全的字符编码转换成为安全的字符编码,为了字符能够安全编码,人们设计了一种编码机制:通过转义表示法来表示不安全的字符,这种表示法包含一个百分号以及这个非安全字符的ASCII编码的十六进制数。如:~的ASCII码值是126(0x7e),那么,在URL中凡是出现~的地方就用%7E来表示(或者说进行转义)。
在URL中,有几个字符被保留起来,有着特殊的含义。URL编码表见此
五、方案的世界
下面是常见的方案格式:
六、展望未来
在未来的日子里,将有一个新颖的URI子集出现——URN.
《完》