在本系列的前两部分中,我介绍了 Schema.org,描述了它针对网络中的机器可读信息的抽象模型,并确定了在 HTML 中表达这些信息的 3 种备选语法 - RDFa、Microdata 和 JSON-LD。
使用其中一种语法,您便可以根据您页面的主题来设置一个词汇表。几乎所有 Schema.org 词汇表都使用 URL 主干 http://schema.org/。这些来自共同兴趣社区的共享约定和贡献,使 Web 发布者能使用网络上的更多结构化数据。它们还使开发人员能更广泛地聚合数据。
许多最常用的 Schema.org 词汇表都是用比较旧的格式来构建的,比如我在 中提到的微格式。其他词汇表基于“friend-of-a-friend”词汇表,这是 RDF 应用程序的主要部分。各种词汇表都不断接受评审和改进。
让我们看看 Schema.org 词汇表,从一些常用的术语开始。
用 Schema.org 描述待售商品因为电子商务非常流行,所以与描述产品和销售信息相关的 Schema.org 词汇表都是流行的词汇表。这些词汇表向产品或用户网站添加了机器可读的数据,而且该数据向 Google、Bing 和 Yandex 等搜索引擎的搜索结果添加了内联注释。
这个电子商务词汇表起源于一个用于电子商务的单独词汇表 GoodRelations,该词汇表是为向涵盖提供者/客户关系的页面添加机器可读数据而开发的。Schema.org 吸收了 GoodRelations,它的类和属性现在得到了广泛使用和支持。
对于电子商务网站,有两个主要类:
- http://schema.org/Product
- http://schema.org/Offer
图 1 给出了来自 的文档页的屏幕截图。因为页面非常长,所以它被截断了,所显示的还不到为 Produce 类型实际定义的属性的四分之一。这些属性涵盖基本属性(名称、描述、关联品牌名称等)和专业属性(全球交易品项识别代码 (GTIN)、基础通用商品代码 (UPC) 的标准集,以及条形码)。
图 1. 产品类
您应该还记得在上一篇文章中,通过 HTML 元素分层结构表达这些属性,或者在 JSON-LD 部分表达这些属性。对于每个属性,Schema.org 都会指定可接受值的类型。在许多情况下,该值是纯文本,由根据您尝试传达的信息来确定合理的类型。还有其他类型的简单数据类型资源值,比如 Number 或 DateTime,而且在某些情况下,这些值来源于 Thing 类,在这种情况下,这些值必须是 URL 引用。在指定属性时,通常有多种类型的资源(或文字值)可供选择。
Schema.org 词汇表偶尔可能会重叠和难以理解。在上图中,category 属性的值可以是 PhysicalActivityCategory、Text 或 Thing。但是,PhysicalActivityCategory 源自对 Schema.org 健康和生命科学的一个扩展,是一个非常随意的、有限的待售商品集。
存在这种矛盾是因为,Schema.org 中的描述被尽可能保持统一,而类和属性有时被重复使用来指代特定的关注领域。因此,您有时会发现不常用的概念被引入主流词汇表描述中。Schema.org 原本是非常不正式的,所以请依靠直觉来正确使用类和属性。
有时,您可以选择使用结构化的值框架,或者仅使用非正式文本字符串。拥有纯文本类别非常类似于社交媒体中的标记。我们将这个非正式的标记集合称为“大众分类”,以便将其与更正式的分类区别开来。
如果单击左列中的一个属性,就会获得该属性的更多详细信息。例如,单击 aggregateRating。您会看到以下页面。
图 2. aggregateRating 属性
在页面底部,可以看到一些有助于入门的示例。几乎所有 Schema.org 类和属性定义都展示了这些示例,您可以选择是否想要看到 Microdata、RDFa 或者 JSON-LD 示例。 |