首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

在 InfoSphere BigInsights Big SQL V3.0 中设置和使用联邦功能(1)

在 InfoSphere BigInsights Big SQL V3.0 中设置和使用联邦功能(1)

本文将通过数据源 Teradata、Oracle、Netezza 和 IBM® DB2 for Linux, UNIX, and Windows 介绍 Big                SQL V3.0 联邦功能。读者应具备一定的数据库系统知识。本文将重点介绍使用 Big SQL V3.0 联邦所需的基本配置。
Big SQL V3.0 联邦(Big SQL V3.0 的一个特性)高度可配置。这里使用的命令语法是一个工作系统的基本设置的简化版本。
完成本文中的操作的前提条件
  • 中的 Big SQL 知识,特别是 BIGSQL 数据库特征方面的知识。
  • 熟悉用作数据源的 DBMS
  • 设置远程服务器的连接和各自的客户端的知识。
  • BIGSQL3 已安装在一个运行 Linux AMD64 或 Linux PPC 的系统上
  • 每个数据源的客户端,它们是在 BIGSQL3 机器上安装和配置的。
  • 通过兼容 Netezza® 客户端的 DataDirect ODBC 来使用 Netezza。
  • Netezza 品牌的 DataDirect Driver 和 Netezza 客户端,可以  它们。
受支持的数据源Big SQL V3.0 联邦服务器支持多个数据源,如 表 1 中所示。
表 1. 支持的数据源和版本数据库管理系统版本DB2®DB2 for Linux, UNIX,                            and Windows v10.5OracleV11g R2Teradata V12Netezza V7.2
了解 HadoopDev,您联系 InfoSphere BigInsights                    开发团队的直接渠道查找已扩展的 BigInsights 开发团队给您带来的重要资源,使用 InfoSphere BigInsights                    执行开发需要这些资源。文档、产品下载、实验、代码示例、帮助、事件、专家博客 — 这里一应俱全。您还可以直接联系开发人员。。
安装InfoSphere BigInsights 的安装程序自动安装这些包装器并应用联邦许可。 表 2 中所示的包装器默认情况下包含在目录                $HOME/sqllib/lib/ 中。
表 2. 包装器数据源类型包装器库辅助文件DB2libdb2drda.solibdb2drdaF.so
                            libdb2drdaU.so
Teradata libdb2teradata.so                            libdb2STteradataF.a

                            libdb2teradataU.so
Oraclelibdb2net8.so                            libdb2net8F.so
libdb2net8U.so
libdb2STnet8F.a                        Netezza libdb2rcodbc.so                            libdb2odbct.so
libdb2rcodbcF.so
libdb2rcodbcU.so                        
因为数据分析对业务成功至关重要,所以需要能支持数据整合和联邦的数据仓库。
Big SQL(IBM InfoSphere® BigInsights™ 的一部分)是 Hadoop 文件系统的 SQL                接口。它支持存储和处理大量数据。Big SQL 联邦实现了一种混合环境,在该环境中,您可以整合大数据并联合使用来自不同数据源的实时数据。
Big SQL V3.0 联邦概述联邦服务器的架构很简单。它包含 Big SQL V3.0 引擎、包装器和远程数据库管理系统 (DBMS) 客户端。
该引擎的一个核心元素是优化器(如图 1                    所示),它负责基于成本分析来选择联邦查询的执行计划。如果需要的话,优化器还可以通过重写查询使其更高效。优化器将查询工作分布在联邦服务器和数据源上,尽可能提高该流程的成本效益。runstats                实用程序(默认已开启)会按照每个昵称自动计算查询的成本。
图 1. Big SQL V3.0 的架构要启用 Big SQL V3.0,您需要提供一个包装器、一个服务器、一个昵称和一个用户映射。
  • 包装器:一个库,用于处理 Big SQL V3.0 联邦服务器与 DBMS                    客户端之间的通信。每种类型的数据源都必须拥有自己的包装器。该包装器将转换传入 Big SQL V3.0 联邦服务器和来自该服务器的查询,以便调用客户端的公开的                    API。客户端与数据源进行通信。
  • 服务器:一个远程数据库。尽管服务器对象是一个远程数据库,但您需要知道此数据库所在的系统,因为该信息确定了用于连接到它的客户端。
  • 昵称:服务器中的数据源(比如一个表、视图或过程)中的一个远程对象。与任何联邦服务器一样,对数据源的使用的管理是透明的。从用户角度定义了远程对象的昵称后,它们的行为就像本地对象一样。如果来自该数据源的数据未发生更改,那么查询的结果将由本地规则确定。在这种情况下,这种透明性很重要,因为                    Big SQL 数据库默认情况下仅使用二进制排序。这种类型的排序会影响在创建服务器对象时需要设置的选项。
  • 用户映射:本地授权 ID 与远程授权 ID 之间的关联。本地 ID 在联邦服务器上运行的所有操作都会使用它映射到的 ID                    在数据源上运行。要查询昵称,用户必须获得在原始表上执行 SELECT                    操作的授权。出于安全原因,在大多数系统上,具有相同密码的相同的授权 ID 必须存在于所有机器上;因此需要使用用户映射。
完成设置后,可以通过 JSqsh 使用 Big SQL V3.0,操作过程类似于访问 Big SQL 版本的过程。要创建联邦对象,需要拥有 DBADM 授权的授权                ID。
返回列表