Web资源访问及HTTP协议详解


下图为在浏览器中输入URL 后的一系列过程:

 

从此图中可以总结出几条结论:

1. 如果DNS服务器坏了,可以直接通过ip地址访问网页,因为DNS只是一个域名和IP地址的MAP;

通过在命令行中输入 “ping 域名”即可;

比如:

在命令行中输入 ping www.baidu.com  ,则出现如下文字: 

 

可以看出 www.baidu.com 的ip地址是119.75.217.56 ;

直接在浏览器中输入 119.75.217.56  即可访问baidu;

2.Host文件位于   C:\Windows\System32\drivers\etc\hosts

此文件的用途:外挂,将游戏升级程序访问的服务器IP改成自己的机器的IP;  再比如优酷等视频网站去除广告就是通过此种方法;

在此文件中修改映射关系可以改变访问的效果,比如在文件中添加:

127.0.0.1     www.sina.com

则打开tomcat;

在浏览器中输入 http://www.sina.com:8080 可以看到tomcat的主页;

因为在访问DNS服务器之前ie会去访问 Hosts文件,如果存在映射关系,则不会去访问DNS服务器;

3.访问静态资源之前其实会访问默认Servlet,如果自己覆盖默认的Servlet,则不能正常访问到静态资源;

覆盖默认Servlet只需要<url-pattern>/</url-Pattern即可;

4.发送HTTP请求的前提是连接服务器;


HTTP协议总结

HTTP协议一般是隐藏在浏览器背后的,如果要查看HTTP协议内容,则需要下载IE插件 HTTPWATCH;

HTTP协议时平台无关的;

HTTP由HTTP请求和HTTP响应组成; 

1.HTTP请求 

一般的HTTP请求如下:

 

1.1请求行 

请求行是由 请求方式、请求资源、请求协议组成; 

1.1.1请求方式 

    请求方式主要有GET和POST两种; 

除了表单提交,其他都是GET请求;

一共有八种请求方式:

 请求方式 作用 
 get  用于请求某个资源,理论上不修改服务器的状态
 post  表单提交
 head  只返回get请求后相应的头,而不用吧相应体(HTML)返回
 trace  显示服务器端接收的信息,用于调试
 put  将包含的信息放在URL中
 delete  指明要删除某个URL对应的资源
 options  列出HTTP方法列表
 connect  建立隧道

幂等:一次请求和多次请求的结果是一样的;

在请求方式中,满足幂等的有:HEAD、GET、PUT;其余的都不是幂等; 

1.1.2请求资源 

    请求资源是要请求返回的web资源; 

1.1.3请求协议 

    请求协议现在一般使用HTTP/1.1,以前使用HTTP/1.0

注意:HTTP/1.1和HTTP/1.0的区别

HTTP是基于TCP/IP之上的,HTTP/1.0是指连接web服务器后只允许一次HTTP请求;HTTP/1.1是指连接web服务器后允许多次HTTP请求;

 

1.2请求头 

请求头是由很多Map组成;

Host 客户机向服务器发送请求的主机名
Accept 客户机支持的数据类型
Accept-Language

客户机支持的语言

Tips:在访问www.google.com 时服务器会解析出客户机支持的语言,然后发回此语言的网页;

Accept-Charset 客户机支持的编码
Accept-Encoding 客户机的压缩格式
Referer

客户机访问此资源的来源;比如从1.html中的超链接请求2.html,则请求2.html时会发送Referer: 1.html

用途:防盗链

  避免从未知网站链接此网站,盗用资源

User-Agent 客户机的软件环境
Connection 客户机发送此连接后的连接状态时继续连接还是断开
Date 客户机发送的时间

注意:请求头和实际内容中间需要加上空行; 

  • 1
  • 2
  • 下一页

相关内容