构建 Web 内容的技术
1. HTML
1.1 Web 页面几乎全由 HTML 构建
HTML(HyperText Markup Language,超文本标记语言)是为了发送 Web 上的超文本(HyperText)而开发的标记语言。平时我们浏览的 Web 页面几乎全是使用 HTML 编写的,由 HTML 构成的文档经浏览器的解析、渲染后,呈现出来的结果就是 Web 页面。
1.2 HTML 版本
HTML 1.0 在 1993 年由伊利诺伊大学的 NCSA 统一标准后发布。
HTML5 在 2014 年正式推荐并使用。HTML 5 标准不仅解决了浏览器之间的兼容性问题,并且可以把文本作为数据对待,更容易复用,动画效果也变得更生动。
1.3 设计应用 CSS
CSS(Cascading Style Sheets,层叠样式表)可以指定如何展现 HTML 内的各种元素,属于样式标准之一。
CSS 的理念就是让文档的结构和设计分离,达到解耦的目的。
2. 动态 HTML
2.1 让 Web 页面动起来的动态 HTML
所谓动态 HTML(Dynamic HTML),是指使用客户端脚本语言将静态的 HTML 内容变成动态的技术的总称。
动态 HTML 技术是通过调用客户端脚本语言 JavaScript ,实现对 HTML 的 Web 页面的动态改造。
利用 DOM(Doucment Object Model,文档对象模型)可指定欲发生动态变化的 HTML 元素。
2.2 更容易控制 HTML 的 DOM
DOM 是用以操作 HTML 文档和 XML 文档的 API。使用 DOM 可以将 HTML 内容的元素当作对象操作。如取出元素内的字符串、改变那个 CSS 的属性等,使页面的设计发生改变。
通过调用 JavaScript 等脚本语言对 DOM 的操作,可以以更为简单的方式控制 HTML 的改变。
DOM 内存在各种函数,使用他们可查阅 HTML 中的各个元素。
3. Web 应用
3.1 通过 Web 提供功能的 Web 应用
Web 应用是指通过 Web 功能提供的应用程序。如购物网站、网上银行、搜索引擎等。
由程序创建的内容称为动态内容,而实现准备好的内容称为静态内容。 Web 应用则作用于动态内容之上。
3.2 与 Web 服务器及程序协作的 GCI
CGI(Common Gateway Interface,通用网关接口)是指 Web 服务器在接收到客户端发送过来的请求后转发给程序的一组机制。在 CGI 的作用下,程序会对请求内容做出相应的动作,如创建 HTMl 等动态内容。
使用 CGI 的程序叫做 CGI 程序,通常是用 Perl、PHP、Ruby 和 C 等编程语言编写而成。
3.3 因 Java 而普及的 Servlet
Servlet 是一种能在服务器上创建动态内容的程序,Servlet 是用 Java 语言实现的一个接口,属于面向企业级 Java 的一部分。
CGI 由于每次接收到请求,程序都有跟着启动一次。因此一旦访问量过大,Web 服务器就要承担相当大的负载。
Servlet 运行在与 Web 服务器相同的进程中,因此收到的负载较小。Servlet 运行的环境叫做 Web 容器或 Servlet 容器。
4. 数据发布的格式及语言
4.1 可扩展的标记语言
XML (eXtensible Markup Language,可扩展标记语言)是一种可按应用目标进行扩展的通用标记语言。旨在通过使用 XML,是互联网数据共享变得更加容易。
XML 和 HTML 一样,使用标签构成树形结构,并且可自定义扩展标签。
从 XML 文档中读取数据比起 HTML 更为简单。由于 XML 的结构基本上都是用标签分割而成的树形结构,因此通过语法分析器(Parser)的解析功能解析 XML 结构并取出数据元素,可更容易的对数据进行读取。
4.2 发布更新信息的 RSS/Atom
RSS(简易信息聚合,也叫聚合内容)和 Atom 都是发布新闻或博客日志等更新信息文档的格式的总称。两者都用到了 XML。
RSS 有以下版本:
RSS 0.9(RDF Site Summary): 最初的 RSS 版本。
RSS 0.91(Rich Site Summary): 在 RSS0.9的基础上扩展元素。非 RDF 规格,使用 XML 方式编写。
RSS 1.0(RDF Site Summary): RSS规格正处于混乱状态。
RSS 2.0(Really Simple Syndication): 非 RSS 1.0 路线。增加支持 RSS0.91 的兼容性。
Atom 具有以下两种标准。
Atom 供稿格式(Atom Syndication Format):为发布内容而制定的网站消息来源格式。
Atom 出版协定(Atom Publishing Protocol): 为 Web 上内容的新增或修改而制定的协议。
4.3 JavaScript 衍生的轻量级医用 JSON
JSON(JavaScript Object Notation)是一种以 JavaScript 的对象表示法为基础的轻量级数据标记语言。
能够处理的数据类型有 false/null/true/对象/数组/数字/字符串 这 7 种类型。
示例:
{"name": "Web Application Security", "num": "TR001"}