Web资源访问及HTTP协议详解

文章由LinuxBoy分享于2019-03-31 05:03:50热评（18）

Web资源访问及HTTP协议详解

下图为在浏览器中输入URL 后的一系列过程：

从此图中可以总结出几条结论：

1. 如果DNS服务器坏了，可以直接通过ip地址访问网页，因为DNS只是一个域名和IP地址的MAP；

通过在命令行中输入 “ping 域名”即可；

比如：

在命令行中输入 ping www.baidu.com ，则出现如下文字：

可以看出 www.baidu.com 的ip地址是119.75.217.56 ；

直接在浏览器中输入 119.75.217.56 即可访问baidu；

2.Host文件位于 C:\Windows\System32\drivers\etc\hosts

此文件的用途：外挂,将游戏升级程序访问的服务器IP改成自己的机器的IP; 再比如优酷等视频网站去除广告就是通过此种方法；

在此文件中修改映射关系可以改变访问的效果，比如在文件中添加：

127.0.0.1 www.sina.com

则打开tomcat；

在浏览器中输入 http://www.sina.com:8080 可以看到tomcat的主页；

因为在访问DNS服务器之前ie会去访问 Hosts文件，如果存在映射关系，则不会去访问DNS服务器；

3.访问静态资源之前其实会访问默认Servlet，如果自己覆盖默认的Servlet，则不能正常访问到静态资源；

覆盖默认Servlet只需要<url-pattern>/</url-Pattern> 即可；

4.发送HTTP请求的前提是连接服务器；

HTTP协议总结

HTTP协议一般是隐藏在浏览器背后的，如果要查看HTTP协议内容，则需要下载IE插件 HTTPWATCH；

HTTP协议时平台无关的；

HTTP由HTTP请求和HTTP响应组成；

1.HTTP请求

一般的HTTP请求如下：

1.1请求行

请求行是由请求方式、请求资源、请求协议组成；

1.1.1请求方式

请求方式主要有GET和POST两种；

除了表单提交，其他都是GET请求；

一共有八种请求方式：

请求方式	作用
get	用于请求某个资源，理论上不修改服务器的状态
post	表单提交
head	只返回get请求后相应的头，而不用吧相应体（HTML）返回
trace	显示服务器端接收的信息，用于调试
put	将包含的信息放在URL中
delete	指明要删除某个URL对应的资源
options	列出HTTP方法列表
connect	建立隧道

幂等：一次请求和多次请求的结果是一样的；

在请求方式中，满足幂等的有：HEAD、GET、PUT;其余的都不是幂等；

1.1.2请求资源

请求资源是要请求返回的web资源；

1.1.3请求协议

请求协议现在一般使用HTTP/1.1，以前使用HTTP/1.0

注意：HTTP/1.1和HTTP/1.0的区别

HTTP是基于TCP/IP之上的，HTTP/1.0是指连接web服务器后只允许一次HTTP请求；HTTP/1.1是指连接web服务器后允许多次HTTP请求；

1.2请求头

请求头是由很多Map组成；

Host	客户机向服务器发送请求的主机名
Accept	客户机支持的数据类型
Accept-Language	客户机支持的语言 Tips：在访问www.google.com 时服务器会解析出客户机支持的语言，然后发回此语言的网页；
Accept-Charset	客户机支持的编码
Accept-Encoding	客户机的压缩格式
Referer	客户机访问此资源的来源；比如从1.html中的超链接请求2.html,则请求2.html时会发送Referer: 1.html 用途：防盗链避免从未知网站链接此网站，盗用资源
User-Agent	客户机的软件环境
Connection	客户机发送此连接后的连接状态时继续连接还是断开
Date	客户机发送的时间

注意：请求头和实际内容中间需要加上空行；

推荐文章：

Web资源访问及HTTP协议详解