首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

Schema.org 信息模型简介(1)

Schema.org 信息模型简介(1)

随着人工智能 (AI) 和认知计算的兴起,对其他计算机可以轻松理解的结构化数据格式的需求与日俱增。为了满足这一需求,在 2011                年,一些搜索引擎公司和大型 Web 发布者创建了一个名为                  的项目,以便描述网页实际涉及的对象。
在这个包含 4 个部分的系列中,我将介绍 Schema.org,展示如何使用它创建更容易搜索的网页。在第 1                部分,我们首先将介绍该项目的历史。
Schema.org 的好处首先,让我们看看 Schema.org 的一些好处。为什么要将 Schema.org                标记添加到您的页面中?最重要的是,这样做可以使您的页面更容易访问,更容易通过搜索引擎、AI 助手和相关 Web                应用程序找到。您不需要学习任何新的开发系统或工具来使用标记,而且在几小时内就可以快速上手。其他好处包括:
  • 为上下文搜索提供帮助。搜索引擎公司和专家开始越来越多地根据特定兴趣来引导用户,而不是通过地毯式的搜索进行引导。他们正在理解用户意图并提供满足用户意图的内容。用户是否在购物?正想找一部电影来看?通过搜索来解决一个技术问题?如果使用                    Schema.org 标记,就会允许搜索引擎根据上下文特征来提供您搜索的网站。如果用户通过语音或在移动设备上搜索,更是如此。
  • 标明已更新的、高质量的内容。在提高搜索引擎排名方面,创建大量高质量的内容并培养您的内容的合法链接,这是其他方法无法替代的。但是使用                    Schema.org 标记会告诉搜索引擎,您的内容经常更新且具有良好品质。
  • 提高点击率。当您经过 Schema.org                    扩充的网站在搜索引擎排名中有所上升时,他们在包含现代上下文特征的清单(称为富摘要)中的排名位置也会上升。富摘要从其他搜索结果中脱颖而出,能得到更高的用户点击率。
  • 改进内容的可维护性。在规划网站内容时,许多人忘了规划如何处理过时或无关的内容。拥有包含                    Schema.org 标记的页面,会使得用户在过渡期间更容易识别这些页面并实施相应计划。添加 Schema.org                    标记后,会让用户更容易开发工具来处理现有页面,并将它们合并到后续网站和软件项目中。还使得您更容易与合作伙伴基于现有网站的新联合项目开展合作。
吸引眼球的主页在 Web 诞生之初,您想查看的所有内容都在一个主页上。最初的这些网页就像贴在公告板上的个人公告,但包含一些超链接。Web                的目的是让人们查看这些页面。
不久以后,Mosaic 浏览器实现了在文本间嵌入图像,这使 Web                变得对用户更具吸引力。嵌入式媒体对象向音频、视频和应用程序对象敞开了大门。很快,除了信息和通信行业,其他行业也开始使用(并最终主导)Web。
“如果有了一种通用语言,我们将能达到更高的自动化程度。Web                    似乎是一个令人惊艳的创新之地,但我们错失了更多的可能性。”

随着互联网数据的爆炸性增长,人们很快就必须对内容进行分类和标记,以便更容易地找到他们想要寻找的信息。
早期的 Web 发明者希望在 Web 上更广泛地传播组织工具。在 20 世纪 90 年代,“Web 数据”技术的研究工作就开始了。人们对 Web                上数据的最初预期是非常高的。2001 年 5 月,Sir Tim Berners-Lee                和同事在科学美国人上发表了一篇名为《语义网》的文章,阐述了他们对一种新技术的雄心,该技术将为 Web                上的数据提供一种通用语言,使自动化变得更容易。
尽管所构想的这种自动化如今在很大程度上已成为现实,但这主要归功于大型搜索引擎和科技公司大量处理数据的卓越功绩,而不是由于针对 Web                上的数据的通用语言的诞生。结果,由于没有通用语言,我们现在拥有的自动化并不是很有用。Web                似乎是一个令人惊艳的创新之地,但我们错过了更多的可能性。
Schema.org 的诞生为语义网带来了生机。通过一些大型企业的努力,即使较小的企业现在也能从 Web 中获益。
RDF、链接数据、微格式等在 2000 年,我为 IBM developerWorks 编写了一篇名为“RDF 简介”的文章,解释了万维网联盟 (W3C)                提倡的这种技术,该技术旨在为 Web 上的数据提供一种通用语言。Resource Description Framework (RDF)                是一组用于在网络上对数据进行建模的规范,旨在让自主代理的工作更轻松,并改进搜索引擎和服务目录。RDF 最初被构想为一种简单模型,用于表示 Web                上的大量数据。
不幸的是,W3C 最终在 RDF 上堆叠了如此多的复杂规范(包括成熟的 AI 工具),以至于他们从未真正弄清楚如何将语义网简化为一个典型 Web                开发人员可以轻松学习的足够简单的东西。
图 1. 语义网堆栈为了抵消这些复杂规范,一个名为“Linked Open Data”的项目开始推行一组简化的原则。该规范的名称简称为“Linked                Data”,并且很明显,这些原则甚至对于企业和私有上下文也很有用。Linked Data 主要推荐使用 HTTP URL                    来标识事物,而不是纯文本字符串,并使用简单 RDF                之类的约定来提供所识别事物的相关信息。例如,此信息可能包括使用了纯文本字符串的标签。
最初,此元数据是与网页本身分开提供的,但 Web 开发人员很快开始提倡使用简单 HTML                    约定将元数据编码到网页中。这些约定称为微格式
十年来取得的所有这些进展都在 2011 年浓缩为 Schema.org。人们寄予厚望的语义网被简化为 Linked                Data,而使用微格式技术消除了对单独文件表示的需求。
返回列表