首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

使用 HTML5 中的 Microdata 增强 Web 应用程序的语义(1)

使用 HTML5 中的 Microdata 增强 Web 应用程序的语义(1)

语义网简介伯纳斯·李(Bemers-Lee)在 2002 年描绘了下一代互联网的前景,并将下一代互联网称为“语义网”(Semantic Web)。他描述道:“语义网是当前网络的延伸,信息在其中被赋予明确含义,从而实现人与计算机的更好协作。”与仅与人可读的万维网不同,语义网是一种智能网络,它的目标是对现行互联网进行扩展,使整个互联网能够自动处理,使全部内容易于使用,建立一个可理解的全球平台。或者说,语义网是机器可理解的信息,是数据网,更是全球性的数据库,在语义网中,一切可以确定的内容,例如人、时间、事件、物体等都作为实体分布在网络中,每个实体都有一个统一资源标识。语义网的核心是元数据,使得原来 Web 环境下难以实现的许多应用成为可能或变得更有效,如信息获取、信息过滤、Web 自动服务等。
如果将当前的 Web 网络理解为一种语法树,它所具有的功能仅仅是将我们输入的信息以某种格式显示出来,这种网络所做的工作只是显示信息。语义网就是在此基础上的进一步发展,是按照我们对于信息理解,从语法到语义、语用的层次过程,将更复杂的理解过程赋于计算机完成,因此可以名副其实地称为“下一代互联网”。
概括地说,语义网是按照能表达页面内容的“词语”链接起来的全球信息网;换言之,是用机器很容易理解和处理的方式连接起来的全球数据库。它是现有的万维网的变革和延伸,它将使“理解网上信息的含义”不再是只有人类才能做到的事情,计算机在一定程度上也能做到,从而有助于信息与智能的共享,并使网络有能力提供动态与主动的服务,从而更利于人机之间的对话和协同工作。例如,对于天气预报的数字人看到就明白其含义,而计算机并不知道哪个数字表示温度,哪个数字表示湿度。语义网的意义就是在隐藏的编码中,指明哪个数字代表温度,哪个数字代表湿度,并说明“温度”和“湿度“的含义。
语义网最大的好处就是让计算机对网络空间所存储的数据进行智能化评估。这样,计算机就可以像人脑一样“理解”信息的含义,完成“智能代理”的功能。另外,使用语义网搜索引擎的结果也将比万维网更为精确。
语义网可以使用 Microformats, RDF, 或 Microdata 等技术实现,以上技术各有所长,本文将以 Microdata 为主进行展开。
HTML5 Microdata 介绍Microdata 以自定义的词汇表(vocabulary)为中心,可以想象 HTML5 中所有的元素集合为一个词汇表,这个词汇表包含描述段落(section) 或文章(article)的元素,但是不包含描述事件(event) 或组织(organization)的元素。如果想在 Web 页面中表示一个事件或组织,则需要定义自己的词汇表,Microdata 允许你这么做,任何人都可以定义自己的词汇表,并且将其包含在自己的 Web 页面中。
Microdata 由名字 / 值(name/value)对组成,每一个词汇表定义一组命名的属性。例如,对于人这个词汇表,可以定义名字、头像、地址等属性。为了在页面中包含特定的 Microdata 属性值(value),需要在特定的地方提供 Microdata 属性名(name)。根据你声明属性名的位置,Microdata 有提取属性值的规则。
Microdata 中范围(scoping)的概念很重要,对于这个概念,可以想象 DOM 中元素的父子关系。元素 <HTML> 通常包含两个子元素,<HEAD> 和 <BODY>,元素 <BODY> 可以有很多子元素,这些子元素又可以有自己的子元素。Microdata 重用 DOM 的等级结构提供一种方式表达:这个元素(element)中所有的属性(properties)都来自这个词汇表(vocabulary)。它允许在一个页面中使用多个词汇表(vocabulary),而且词汇表之间可以内嵌,这些全部通过对 DOM 自有结构的使用完成。
现在已经提及到 DOM,这里再赘述下。Microdata 是用来对 Web 页面上已经存在的数据提供附加的语义,它并不是被设计用来作为独立的数据格式,它是对 HTML 的一种补充。下面的章节中你将看到:如果能正确地使用 HTML,Microdata 将很好的工作,但是 HTML 的词汇表表达能力并不是很强。
返回列表