首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

RDF 概念上的更新和一些本体论知识(1)

RDF 概念上的更新和一些本体论知识(1)

本帖最后由 look_w 于 2018-10-18 17:02 编辑

简介 RDF 是一个用于描述对象的模型。这些对象的范围可以是物理对象,如行星、人或国家;也可以是虚拟对象,如博客文章或 wiki 页面;还可以是抽象的对象,如文档或聊天消息的定义。本体论 是一种对象定义体系,您可以通过 RDF 建模实现它。
本文将详细介绍一些 RDF 概念规范的最近更新和一些最新的本体论规范。这篇文章提供了大量技术细节。如果您希望获得有关 RDF 的基本指南,我建议您阅读 IBM developerWorks 上由 Uche Ogbuji 撰写的 “An introduction to RDF” 或万维网联盟 (W3C) RDF 入门(参阅 )。
RDF 和链接数据最近一个与 RDF 有关的概念更新就是链接数据的概念。对于 “链接数据是什么” 的问题存在许多误解,尤其是在链接数据和语义 Web 社区。我会为所有具有一定 Web 技术知识的人尽量简单地解释。链接数据相对容易掌握,因为它就是一种简单的概念,具有几千年的历史跨度。实际上,它与人类与生俱来的观察、命名、研究和描述现实世界对象的能力有关。
要了解链接数据对象,您必须首先理解数据对象和分布式数据对象。数据对象 是对观察结果(即对象)的命名的(即贴上标签)描述(即封装)。分布式数据对象 是指需要使用标识符作为关键字(或句柄)通过网络进行访问的数据对象,因此类似于根据名称,或者从技术的角度讲,使用主关键字(数据库术语)通过网络调用某些人或某些事物。
链接数据对象 是具有统一标识符形式的分布式数据对象,我的意思是说所有链接数据对象标识符都具有一致的外形和形式。一个很好的例子就是使用超文本传输协议 (HTTP) 国家化资源标识符 (IRI) 作为一种统一的标识符形式。以 Doctor Who television 节目为例,该项目具有以下标识符:。这是 Doctor Who 的链接数据标识符。您可以使用 HTTP 解除引用 (dereference),表示您使用它作为定位符来通过 HTTP 检索有关该网站的信息。您还可以在自己的数据存储中使用它作为引用。例如,假设您写了一些有关 Doctor Who 这部电视剧的感想,您希望存储这些内容供以后使用。实际上,您是将这些记录附加到个人数据存储中的标识符  后。注意,内容位于您的数据存储,而不是英国广播公司 (BBC) 的数据存储中。您记录的内容是属于您的数据,而节目描述则属于 BBC。
有关链接数据的一个常见误区是要求数据使用某一种 RDF 格式(如 Turtle、RDF/XML、RDFa 或 N3)。这种假设显然是错误的。实际上,数据只需要采用某一种可通过可解除引用的统一资源标识符 (URI) 或 IRI 访问的格式,即 W3C 中的可访问对象标识符或互联网工程设计特别小组 (IETF) 网络资源标识符格式。可以使用 RDF 描述链接数据对象,但是必须注意链接数据不一定必须使用 RDF。
本体论许多本体论都是专门针对 RDF 的。它们通常使用网络本体语言 (OWL) 定义,或使用 RDF 模式 (RDFS) 系统以类似的方式定义。本体论用于定义许多类型的事物,例如:
  • 博客文章是什么,使用语义互连的在线社区项目 (SIOC) 本体论。
  • 标记之间如何关联,使用 Meaning Of A Tag (MOAT) 和简易知识组织系统 (SKOS) 本体论。
  • 用户配置文件与哪些属性相关,使用 Friend of a Friend (FOAF) 本体论。
有关如何开发本体论的内容超出了本文的范围。如果您希望了解有关本体论的更多知识,IBM developerWorks 中有关于使用 OWL 创建本体论的优秀教程,作者是 Michel Mitri 和 Nicholas Chase。参见 ,获得有关该主题和其他文章和教程的链接。
RDF 概念更新RDF 概念文档的理念是指定 RDF 建模规则,即许多现代数据存储提供的相对简单的主-谓-宾三重结构以及最新的图-主-谓-宾四重结构背后隐藏的逻辑复杂性。
比较规范版本 1.0 和 1.1 2004 RDF 概念和抽象语法 1.0 建议与 2011 年的工作草稿有许多不同之处。最重要的差异是 RDF 从 RDF/XML 中分离出来,在语言代码方面显式使用 Best Current Practice (BCP) 47,使用 Unicode 友好的 IRI 而不是基于 ASCII 的 URI,使用 Skolem IRI 而不是未命名的空白节点 (blank node),以及从 RDF 概念中去除可扩展标记语言 (XML) 类型。除此之外,大部分修改都基于规范清除 (cleanup) 和使用语言的语义与实际流 (pragmatic flow)。对 2004 版作出的更多修改可以在 2011 工作草案中查看。这些修改的含义显然要比修改本身更有意义,下面将介绍这些修改。
RDF 概念和抽象语法 1.1 的含义请注意,在撰写本文之际,RDF 概念 1.1 规范正处于工作草案状态,这意味着一些概念可能还没有包含到最终的发布规范中。尽管如此,它也展示了一些更新的想法和最佳实践。您必须认识到这是一个 RDF 概念文档,因此,它侧重于概念而不是任何具体的格式。W3C 的 RDF 工作组将在 2013 年 2 月完成对 RDF 概念、RDFS、Turtle、RDF/XML 和 RDF/JSON 的更新。
根据以上对 RDF 概念修改的概述,您可以发现语义 Web 社区的开发人员使用 RDF 作为一种建模框架(就好像应该使用它一样),并将其从格式(不管是 XML 还是 Turtle 等)中分离出来。这种改变允许在未来为 RDF 模型开发和使用其他格式。这种改变还意味着开发人员可以使用他们熟悉的格式,或者最适合正在开发的特定软件或 Web 应用程序的格式。它还允许第三方服务或库从一种格式转换为另一种格式,而不会产生逻辑问题。
使用全球友好的字符集一直是 W3C 的核心,正如该组织的名称所暗示的一样。因此,在整个 RDF 框架及其格式中继续使用 Unicode 非常重要。您将看到规范从 Unicode v3 升级到 Unicode v4,以及要求使用基于 Unicode 的 IRI 而不是基于 ASCII 的 URI。
空白节点一直是语义 Web 理论中的一个难点,并导致每个数据存储实现的方式都不同,通常采用不一致的方式。Skolemization 源自于正式的逻辑理论,而 Skolem IRI 被建议用作一种全球惟一的统一 IRI 生成系统。关于这一点仍然存在许多争论,有些人认为使用 Skolem 这个名称并不妥当,因为它具有明显的数学特性和潜在的概念行李 (conceptual baggage)。这个部分中最重要的方面是在创建、操作和呈现数据时避免使用空白节点。
工作草案的最后一个重要意义是,承认 RDF 中的文字值(即明文值)与 XML 文字数据类型具有一定联系。该概念的目的是将 RDF 从其对 XML 规范的实际或象征性依赖中完全分离出来,因此,需要从 XML 文字数据类型中去除 RDF。RDF 工作组并没有说明 RDF 文字具体是什么样的。然而,除了开发人员在为文字定义语言(如,en 用于普通英语,或 zh_Hant 用于繁体中文中的汉语)时必须使用 BCP 47 语言标记外,RDF 1.1 中的文字与 RDF 1.0 中的文字并没有什么不同。
返回列表