Skip to content

WWW 万维网

考情分析

WWW(World Wide Web,万维网)是 408 应用层的基础概念。考查频率不算最高,但属于大纲明确点,主要以选择题形式考查 WWW 的组成、URL 的格式、超文本与超链接的概念,以及 WWW 与 HTTP/HTML 之间的关系。

考频:★★

WWW 是什么

WWW(万维网)不是一个具体的协议,而是建立在 Internet 之上的一个大规模的、联机式的信息储藏所。它通过超链接把分散在世界各地的信息组织成一个相互关联的整体,用户可以通过浏览器从一个网页跳转到另一个网页。

需要特别注意:WWW ≠ Internet。Internet 是基础设施(提供 TCP/IP 通信能力),WWW 是建立在 Internet 之上的一种应用。除了 WWW,Internet 上还有 Email、FTP、DNS 等其他应用。

WWW 的核心三要素

408 考点里 WWW 由三个核心技术组成:

要素作用标准
URL唯一标识 Web 资源RFC 3986
HTTP在客户端和服务器之间传输 Web 资源RFC 7230
HTML描述网页的内容和结构W3C

这三者的关系:用户在浏览器输入一个 URL,浏览器通过 HTTP 协议从服务器获取一份 HTML 文档,然后渲染显示给用户。

┌────────┐         HTTP         ┌────────┐
│ 浏览器 │ ──── URL 请求 ────→  │ 服务器 │
│        │ ←── HTML 响应 ─────  │        │
└────────┘                       └────────┘

 渲染 HTML
 → 网页

URL 统一资源定位符

URL(Uniform Resource Locator)用于唯一标识 Web 上的一个资源。其一般格式为:

协议://主机:端口/路径

例如:

https://www.codebrick.tech:443/cn-blog/posts/application/www.html
└─┬─┘   └────────┬─────────┘└┬┘└──────────────┬──────────────────┘
 协议        主机          端口            路径

各部分说明:

部分说明示例
协议访问资源使用的协议http、https、ftp
主机资源所在的主机域名或 IPwww.example.com
端口服务监听的端口号(可选)80(HTTP默认)、443(HTTPS默认)
路径资源在主机上的位置/docs/index.html

注意点

  • URL 中的字符不区分大小写(但路径部分有些服务器区分大小写)
  • 默认端口可以省略(http 默认 80,https 默认 443)
  • URL 是 URI 的一种特殊情况

超文本与超媒体

超文本(Hypertext):包含**指向其他文档的指针(超链接)**的文档。读者可以点击超链接,从一份文档跳转到另一份文档,不再受线性阅读顺序的限制。

超媒体(Hypermedia):在超文本的基础上扩展,文档内容不仅是文字,还包括图片、音频、视频、动画等多种媒体形式。

WWW 中的网页本质上是超媒体——包含文字、图片、视频,并通过 HTML 中的 <a> 标签互相链接。

html
<!-- HTML 中的超链接 -->
<a href="https://www.codebrick.tech/">访问 CodeBrick</a>

超链接是 WWW 之所以"万维"的关键——通过超链接,所有 Web 资源构成了一张相互关联的网。

WWW 的工作流程

以"打开 https://www.example.com" 为例:

  1. 浏览器解析 URL:从 URL 中提取协议(https)、主机(www.example.com)、端口(默认 443)、路径(/)
  2. DNS 解析:浏览器向 DNS 服务器查询 www.example.com 对应的 IP 地址
  3. 建立 TCP 连接:浏览器与服务器的 443 端口建立 TCP 连接(HTTPS 还要 TLS 握手)
  4. 发送 HTTP 请求:浏览器发出 GET / HTTP/1.1 请求
  5. 服务器响应:服务器返回 HTML 文档及状态码
  6. 解析 HTML:浏览器解析 HTML,发现其中引用的图片、CSS、JS 等资源,对每个资源重复 1-5 步获取
  7. 渲染页面:浏览器把所有资源组合起来,渲染成用户看到的网页

一个完整的网页加载通常涉及几十个甚至上百个 HTTP 请求——这也是为什么 HTTP/1.1 引入持久连接、HTTP/2 引入多路复用的原因。

静态网页与动态网页

特性静态网页动态网页
文件形式服务器上预先存好的 HTML 文件由服务器程序根据请求动态生成
内容固定不变可以根据用户、时间、参数变化
服务端开销大(需要执行程序)
例子文档、博客文章搜索结果、用户主页、购物车

408 中只需要理解静态/动态网页的概念区别,不要求掌握具体实现技术。

WWW 与 HTTP 的关系

这是一个常考的概念辨析点:

  • WWW 是一个信息系统的整体概念——它包括 URL、HTTP、HTML 三个核心标准,加上海量的网页资源和超链接关系
  • HTTP 是 WWW 中负责传输的协议——它解决了"如何把 HTML 文件从服务器传到浏览器"这一具体问题

可以打个比方:WWW 像一个城市的整体设施(道路 + 建筑 + 居民),HTTP 只是其中的"快递服务"。除了 HTTP,WWW 历史上和现在还使用了其他协议(HTTPS、QUIC、FTP 等),但这些都是 WWW 的组成部分,不是 WWW 本身。

易混淆知识点

1. WWW 和 Internet 是同一个东西吗?

不是。Internet 是底层的网络基础设施(基于 TCP/IP 协议族),提供主机之间的通信能力;WWW 是建立在 Internet 之上的一种应用。Internet 还可以承载 Email、FTP、DNS 等其他应用,它们都不属于 WWW。

2. WWW 使用的协议只有 HTTP 吗?

不完全是。WWW 的核心传输协议是 HTTP/HTTPS,但加载一个网页时还会用到 DNS、TLS、TCP 等多个协议。HTTP 只是 WWW 的应用层传输部分。

3. 超文本和超媒体的区别?

超文本只包含文字 + 超链接;超媒体在超文本的基础上加入了图片、音频、视频等多种媒体形式。现代 WWW 中的网页基本都是超媒体。

4. URL 和 URI 的区别?

URI(Uniform Resource Identifier)是更广义的概念,用于标识一个资源;URL 是 URI 的一种,不仅标识资源,还指明了如何定位(访问)该资源。可以理解为:所有 URL 都是 URI,但不是所有 URI 都是 URL。408 中一般不严格区分这两个概念。

考点清单

  • WWW(万维网)是建立在 Internet 上的大规模超链接信息系统,WWW ≠ Internet
  • WWW 的三大核心标准:URL(标识资源)、HTTP(传输资源)、HTML(描述资源)
  • URL 格式:协议://主机:端口/路径,默认端口可省略
  • 超文本是包含超链接的文本,超媒体是超文本 + 多媒体
  • 加载一个网页可能涉及多个资源、多个 HTTP 请求
  • 静态网页是服务器上的固定文件,动态网页是服务器程序生成的