1,URL详解
我们每天使用URL来访问网页,本节我们来看看URL的基本知识。
URL的全称是Uniform Resource Locator,中文译名为“统一资源定位符”,用于完整地描述 Internet 上某一处资源的地址。
Internet上的每个网页都有一个标识,一般称之为URL地址,或者Web地址,俗称“网址”。
URL地址可以是本地磁盘,也可以是局域网上的某一台计算机,更多的是Internet上的站点。
URI 的全称是 Uniform Resource Identifier,中文译名为“统一资源标识符”,用来唯一地标识一个资源。而URL是一种具体的URI。
我们可以简单地把URI和URL看作同一个东西。
2,URL格式
schema://host[:port#]/path/.../[?query-string][#anchor]
schema 指定低层使用的协议(例如:http, https, ftp)
host HTTP 服务器的 IP地址或者域名
Port# HTTP服务器的默认端口是80,这种情况下端口号可以省略。如果使 用了别的端口,则必须指明,例如http://www.cnblogs.com:8080/
path 访问资源的路径
query-string 发送给http 服务器的数据
anchor 锚
URL的一个例子如下:
http://www.mywebsite.com/tankxiao/test/test.aspx?name=sviergn&x=true#stuff
Schema(协议): http
host(域名): www.mywebsite.com
path(资源的路径): /tankxiao/test/test.aspx
Query String(参数): name=sviergn&x=true
Anchor(锚): stuff
3,URL中的锚点
锚点(Anchor)是一种超链接,只是它是页面内部的超链接。
假如有一个网页很长,而且里面的内容可以分为N个部分。这样的话,我们就可以在网页的顶部设置一些错点,以便浏览者单击相应的锚点,快速到达本页内相应的位置,而不必在一个很长的网页里自行寻找。
锚点在URL的最右边,前面有一个字符“#”。比如下面的#source: http://www.cnblogs.com/TankXiao/p/7087990.html#source。
4,HTTP请求方法
HTTP协议中定义了几种不同的请求命令,这些命令叫作HTTP方法(HTTPMethod)。每个HTTP请求报文中都包含一个方法,这个方法会告诉服务器要执行什么动作,如是要获取一个Web页面还是要删除一个文件。
HTTP协议定义了很多与服务器交互的方法,最基本的有5种,分别是GET、HEAD、
POST、PUT、DELETE。一个URL地址用于描述一个网络上的资源,而HTTP中的GET、
POST、PUT、DELETE就对应着对这个资源的查、改、增、删4个操作。最常见的是GET和POST。GET一般用于获取/查询资源信息,而POST一般用于更新资源信息。
1 GET 请求指定的页面信息并返回实体主体
2 HEAD 类似于GET请求,只不过返回的响应中没有具体的内容,用于获取报头
3 POST 向指定资源提交数据进行处理请求(例如提交表单或者上传文件),数据被包含在请求体中。POST 请求可能会导致新的资源的建立和/或对已有资源的修改
4 PUT 从客户端向服务器传送的数据取代指定文档的内容
5 DELETE 请求服务器删除指定的页面
5,GET方法
打开网页一般都是get方法,因为要从WEB服务器获取信息
浏览器也可以在GET方法中把数据传给服务器,数据放在URL的问号(?)后面。
将查询字符串参数追加到URL末尾,以便将信息发送给服务器。这种方式叫查询字符串,或者叫 Query String.
例如,百度中某搜索URL如下:
https://www.baidu.com/s?ie=utf-8&newi=1&mod=l&isbd=1&isid=8e7b7a240008899f&wd=%E5%8D%9A%E5%AE%A2%E5%9B%AD%E5%B0%8F%E5%9D%A6%E5%85%8B&rsv_spt=l&rsv_iqid=0xc6716da200078907&issp=1&f=8&rsy_bp=l&rsv_idx=2&ie=utf-8&rqlang=cn&tn=baiduhome_pg&rsy_enter=0
查询字符串以“名=值”这样的形式出现,多个名值之间用字符“&”隔开。
查询字符串参数。
在Fiddler中,使用 WebForms选项卡可以更清楚地看到GET方法中的
6,POST方法
POST方法通常是把表单的中的数据发送给服务器
7,POST和GET的区别
GET和 POST 的区别主要表现在如下方面。
1, GET提交的数据会放在URL之后,以同号(?)分割URL和传输数据,参数之 方法是把提交的数据放在间以&相连,如 EditPosts.aspx?name=test1&id-123456。POSTHTTP包的Body 中.
2, GET 提交的数据大小有限制(因为浏览器对URL的长度有限制),而POST方法提交的数据大小没有限制。
3,GET 方式需要使用 Request.QucryString来取得变量的值,而 POST 方法通过Request.Form来获取变量的值。
4,GET 方式提交数据会带来安全问题,比如一个登录页面通过GET方式提交数据时,用户名和密码将出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获得该用户的账号和密码。
8,什么是HTTP状态码
每个HTTP响应报文都会携带一个状态码,用于告诉客户端请求是否成功。状态码是一个3位数字的代码。
HTTP状态码存在于 HTTP 的响应报文中,其作用是 Web 服务器用来告诉客户端发生了什么事。
HTTP响应报文中的第一行,由HTTP协议版本号、状态码、状态消息3部分组成。状态码用来告诉HTTP 客户端 Web 服务器是否产生了预期的HTTP响应。
9,HTTP状态码分类
HTTP/1.1中定义了5类状态码,状态码由3位数字组成,第一个数字定义了响应的类别。
HTTP状态码被分为5大类,随着协议的发展,HTTP规范中会定义更多的状态码。
小技巧:假如看到一个状态码518而不知道其具体是什么意思,这时候只要知道 518
属于“5XX”(服务器错误)就可以了。
XX 100~101 信息提示,表示请求已被成功接收,继续处理
2XX 200~206 成功,表示请求已被成功接收、理解、接受
3XX 300~305 重定向,要完成请求,必须进行更进一步的处理
4XX 400~415 客户端错误,请求有语法错误或请求无法实现
5XX 500~505 服务器错误,服务器未能实现合法的请求
10,常见的状态码
200 OK:服务器成功处理了请求(这个是我们见到最多的)
301/302 Moved Pcrmanently (重定向):请求的 URL 已移走。Response 中应该包含一个Location URL,说明资源现在所处的位置
304 Not Modified(未修改):客户的缓存资源是最新的,需要客户端使用缓存
404 Not Found:未找到资源
401禁止访问
501 Internal Server Error:服务器遇到一个错误,使其无法对请求提供服务