Appearance
WWW 万维网
考情分析
WWW(World Wide Web,万维网)是 408 应用层的基础概念。考查频率不算最高,但属于大纲明确点,主要以选择题形式考查 WWW 的组成、URL 的格式、超文本与超链接的概念,以及 WWW 与 HTTP/HTML 之间的关系。
考频:★★
WWW 是什么
WWW(万维网)不是一个具体的协议,而是建立在 Internet 之上的一个大规模的、联机式的信息储藏所。它通过超链接把分散在世界各地的信息组织成一个相互关联的整体,用户可以通过浏览器从一个网页跳转到另一个网页。
需要特别注意:WWW ≠ Internet。Internet 是基础设施(提供 TCP/IP 通信能力),WWW 是建立在 Internet 之上的一种应用。除了 WWW,Internet 上还有 Email、FTP、DNS 等其他应用。
WWW 的核心三要素
408 考点里 WWW 由三个核心技术组成:
| 要素 | 作用 | 标准 |
|---|---|---|
| URL | 唯一标识 Web 资源 | RFC 3986 |
| HTTP | 在客户端和服务器之间传输 Web 资源 | RFC 7230 |
| HTML | 描述网页的内容和结构 | W3C |
这三者的关系:用户在浏览器输入一个 URL,浏览器通过 HTTP 协议从服务器获取一份 HTML 文档,然后渲染显示给用户。
┌────────┐ HTTP ┌────────┐
│ 浏览器 │ ──── URL 请求 ────→ │ 服务器 │
│ │ ←── HTML 响应 ───── │ │
└────────┘ └────────┘
↓
渲染 HTML
→ 网页URL 统一资源定位符
URL(Uniform Resource Locator)用于唯一标识 Web 上的一个资源。其一般格式为:
例如:
https://www.codebrick.tech:443/cn-blog/posts/application/www.html
└─┬─┘ └────────┬─────────┘└┬┘└──────────────┬──────────────────┘
协议 主机 端口 路径各部分说明:
| 部分 | 说明 | 示例 |
|---|---|---|
| 协议 | 访问资源使用的协议 | http、https、ftp |
| 主机 | 资源所在的主机域名或 IP | www.example.com |
| 端口 | 服务监听的端口号(可选) | 80(HTTP默认)、443(HTTPS默认) |
| 路径 | 资源在主机上的位置 | /docs/index.html |
注意点:
- URL 中的字符不区分大小写(但路径部分有些服务器区分大小写)
- 默认端口可以省略(http 默认 80,https 默认 443)
- URL 是 URI 的一种特殊情况
超文本与超媒体
超文本(Hypertext):包含**指向其他文档的指针(超链接)**的文档。读者可以点击超链接,从一份文档跳转到另一份文档,不再受线性阅读顺序的限制。
超媒体(Hypermedia):在超文本的基础上扩展,文档内容不仅是文字,还包括图片、音频、视频、动画等多种媒体形式。
WWW 中的网页本质上是超媒体——包含文字、图片、视频,并通过 HTML 中的 <a> 标签互相链接。
html
<!-- HTML 中的超链接 -->
<a href="https://www.codebrick.tech/">访问 CodeBrick</a>超链接是 WWW 之所以"万维"的关键——通过超链接,所有 Web 资源构成了一张相互关联的网。
WWW 的工作流程
以"打开 https://www.example.com" 为例:
- 浏览器解析 URL:从 URL 中提取协议(https)、主机(www.example.com)、端口(默认 443)、路径(/)
- DNS 解析:浏览器向 DNS 服务器查询 www.example.com 对应的 IP 地址
- 建立 TCP 连接:浏览器与服务器的 443 端口建立 TCP 连接(HTTPS 还要 TLS 握手)
- 发送 HTTP 请求:浏览器发出 GET / HTTP/1.1 请求
- 服务器响应:服务器返回 HTML 文档及状态码
- 解析 HTML:浏览器解析 HTML,发现其中引用的图片、CSS、JS 等资源,对每个资源重复 1-5 步获取
- 渲染页面:浏览器把所有资源组合起来,渲染成用户看到的网页
一个完整的网页加载通常涉及几十个甚至上百个 HTTP 请求——这也是为什么 HTTP/1.1 引入持久连接、HTTP/2 引入多路复用的原因。
静态网页与动态网页
| 特性 | 静态网页 | 动态网页 |
|---|---|---|
| 文件形式 | 服务器上预先存好的 HTML 文件 | 由服务器程序根据请求动态生成 |
| 内容 | 固定不变 | 可以根据用户、时间、参数变化 |
| 服务端开销 | 小 | 大(需要执行程序) |
| 例子 | 文档、博客文章 | 搜索结果、用户主页、购物车 |
408 中只需要理解静态/动态网页的概念区别,不要求掌握具体实现技术。
WWW 与 HTTP 的关系
这是一个常考的概念辨析点:
- WWW 是一个信息系统的整体概念——它包括 URL、HTTP、HTML 三个核心标准,加上海量的网页资源和超链接关系
- HTTP 是 WWW 中负责传输的协议——它解决了"如何把 HTML 文件从服务器传到浏览器"这一具体问题
可以打个比方:WWW 像一个城市的整体设施(道路 + 建筑 + 居民),HTTP 只是其中的"快递服务"。除了 HTTP,WWW 历史上和现在还使用了其他协议(HTTPS、QUIC、FTP 等),但这些都是 WWW 的组成部分,不是 WWW 本身。
易混淆知识点
1. WWW 和 Internet 是同一个东西吗?
不是。Internet 是底层的网络基础设施(基于 TCP/IP 协议族),提供主机之间的通信能力;WWW 是建立在 Internet 之上的一种应用。Internet 还可以承载 Email、FTP、DNS 等其他应用,它们都不属于 WWW。
2. WWW 使用的协议只有 HTTP 吗?
不完全是。WWW 的核心传输协议是 HTTP/HTTPS,但加载一个网页时还会用到 DNS、TLS、TCP 等多个协议。HTTP 只是 WWW 的应用层传输部分。
3. 超文本和超媒体的区别?
超文本只包含文字 + 超链接;超媒体在超文本的基础上加入了图片、音频、视频等多种媒体形式。现代 WWW 中的网页基本都是超媒体。
4. URL 和 URI 的区别?
URI(Uniform Resource Identifier)是更广义的概念,用于标识一个资源;URL 是 URI 的一种,不仅标识资源,还指明了如何定位(访问)该资源。可以理解为:所有 URL 都是 URI,但不是所有 URI 都是 URL。408 中一般不严格区分这两个概念。
考点清单
- WWW(万维网)是建立在 Internet 上的大规模超链接信息系统,WWW ≠ Internet
- WWW 的三大核心标准:URL(标识资源)、HTTP(传输资源)、HTML(描述资源)
- URL 格式:
协议://主机:端口/路径,默认端口可省略 - 超文本是包含超链接的文本,超媒体是超文本 + 多媒体
- 加载一个网页可能涉及多个资源、多个 HTTP 请求
- 静态网页是服务器上的固定文件,动态网页是服务器程序生成的