首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

IBM dashDB Local 从入门到精通,第 4 部分 dashDB local MPP Linux 安装指南(9)

IBM dashDB Local 从入门到精通,第 4 部分 dashDB local MPP Linux 安装指南(9)

IBM dashDB Local 是一个非常灵活的数据仓库系统,它采用业界领先的 Docker 容器技术,专门优化用来快速部署于私有云或虚拟私有云环境。dashDB Local        采用基于内存优化的、列式存储技术,并结合自动水平扩展能力,充分提高了数据仓库系统的运行效率。
dashDB Local 可以满足客户需要采用基于云的解决方案,但由于隐私及监管的要求,需要将数据保留在自己的数据中心的需求。它提供了 IBM 全托管云数据分析系统 dashDB        的灵活性及分析能力,同时允许客户自己管理及维护数据。同时,dashDB Local 采用了 IBM        通用分析引擎架构,可以帮助用户在私有云、公有云及数据仓库一体机环境之间轻松移动数据,充分满足用户的各种需求。另外,一些客户需要测试云环境数据分析能力,也可以采用 dashDB        Local 部署在本地环境来进行熟悉及演练。
基于云的全托管数据仓库分析系统,IBM 提供了 dashDB 。
dashDB Local 部署在 Docker 容器中,它支持任何 Docker 所支持的操作系统。目前,dashDB Local 可以部署在 Windows、MAC 及 Linux        (RHEL, Ubuntu, CentOS)。更多的信息,大家可以参考 Docker website

dashDB LocalMPP 概述
dashDB Local 容器对用户来说相当于一个黑盒子,它包含了运行 dashDB Local 所需要的所有依赖包及相应的环境。dashDB Local        可以运行在 SMP 环境,也可以运行在 MPP 环境。dashDB Local MPP 最少包含 3 个节点,最多支持 24 个节点,如果使用 dashDB Local 1.7        或更高版本,部署时系统内存容量超过 960 GB,dashDB Local MPP 可以支持 60 个节点。通常,dashDB Local MPP 的配置如下图所示:
图 1. dashDB Local MPP          典型配置
  • dashDB Local MPP 最少包含 3 个 nodes,最多支持 24 个 nodes,dashDB Local 1.7 或更高版本,可以最多支持 60 个          nodes
  • dashDB Local MPP 包含 1 个 head node,多个 data node
  • 每台主机运行一个 dashDB Local 容器
  • 主机可以是裸机(bare metal)或虚拟机
  • LDAP 服务器及控制台 Console 同一时间只在一个节点上被激活,通常运行在 head node 上
dashDB Local MPP 集群内存总量大小决定了最大分区数量及最大节点个数:
  • 如果使用 dashDB Local 1.6 或更低版本,不管集群内存总量是多少,将分配 24 个数据分区,最多支持 24 个节点(1 个 head 节点,23 个数据节点)。数据分区分布在所有节点上,根据节点的个数,每一个节点会分配相应数量的分区,如下所示:
    • 3 个容器->分配 8 个分区
    • 4 个容器->分配 6 个分区
    • 6 个容器->分配 4 个分区
  • 如果使用 dashDB Local 1.7 或更高版本,部署时集群内存总量至少 960 GB,将分配 60 个数据分区,最多支持 60 个节点(1 个 head 节点,59          个数据节点)。
  • 如果使用 dashDB Local 1.7 或更高版本,部署时集群内存总量少于 960 GB,将分配 24 个数据分区,最多支持 24 个节点(1 个 head 节点,23          个数据节点)。部署后,即使扩充内存总量超过 960 GB ,最多也只支持 24 个节点。
注册参加 dashDB Local        Trial Program申请 Docker Hub ID
  • 从 Docker Hub 主页注册 Docker          Hub ID
  • 你将收到确认邮件,并按照邮件提示内容激活 Docker Hub ID
注册参加 dashDB Local        Trial program
  • 在浏览器中,打开 dashDB Local 主页
  • 点击"Try it for free" 黄色按钮
  • 按照要求填写完成注册表单内容并提交 Docker Hub ID。你也可以使用已经存在的 IBM ID
你需要等待 24 小时收到从 Docker 发来的确认邮件,授权你可以访问 dashDB Local private repository        (ibmdashdb/local)并可以下载 dashDB Local 产品镜像。
安装要求硬件要求下边列表,提供了部署 dashDB Local 最小及建议硬件要求:
表 1. dashDB Local          最小及建议硬件要求系统需求
最小配置
单机(Linux)最小配置
多机 (MPP)建议配置
4TB raw data per Host 主机操作系统
Docker supported OS
(Kernel              3.10+)  Docker supported OS
(Kernel              3.10+)  CentOS 7 / RHEL 7  处理器
1x 2.0 GHz Core  每个节点 8x 2.0 GHz Core  每个节点 2 x 2.6 GHz 12-core Xeon              2690v3 CPU  内存
8GB  每个节点 64GB  每个节点 256GB  存储
内置盘至少 300GB
在生产环境,建议为/var/lib/docker              目录创建单独的逻辑卷。如果/var/lib/docker 目录不在根目录下,需要为根目录至少分配 100GB 空间,为/var/lib/docker 目录分配至少              200GB 空间。  每个节点内置盘至少 300GB
在生产环境,建议为/var/lib/docker              目录创建单独的逻辑卷。如果/var/lib/docker 目录不在根目录下,需要为根目录至少分配 100GB 空间,为/var/lib/docker 目录分配至少              200GB 空间。  Network attached (SAN)
2000GB              SSD @ 3000MB/sec IO  Docker 版本
1.12.6  1.12.6  1.12.6
本次 dashDB Local MPP 安装示例,我们使用 3 台 Linux 服务器,操作系统使用 CentOS 7.2,每台主机配置为处理器:8x 2.0 GHz        Core,内存:64GB;使用了一个 Virtual SAN 共享存储,分配了 200GB 空间;每台主机安装了 IBM Spectrum Scale (GPFS 4.1.        1.11)并挂接在/mnt/clusterfs 目录上;Docker 采用 Docker Engine 1.12.6,使用 Device Mapper storage driver        (devicemapper),如下图所示:
图 2. dashDB Local MPP 3          节点典型配置集群文件系统要求
dashDB Local MPP 需要部署 POSIX 兼容的集群文件系统来使多个节点并发访问同一个文件系统。该 POSIX 兼容的集群文件系统需要挂接在/mnt/clusterfs        目录,提供至少 500 GB 空间。常见的 POSIX 兼容的集群文件系统包括 IBM Spectrum Scale (formerly IBM General Parallel        File System, or GPFS)、GFS2、VxFS、CXFSx、NFS,如果使用 Spectrum Scale on POWER Linux LE 平台,需要        Spectrum Scale 4.2.1.2 或更高版本。
根据系统不同要求,我们可以参考下述比较列表来选择 NAS 或 SAN 存储方式来满足我们的业务需求:
表 2. dashDB Local MPP          NAS 同 SAN 存储方式比较
NAS
SAN
文件系统类型
文件服务器,允许客户端通过网络访问,提供文件级访问。NAS 通常很稳定。  专用的网络存储设备,提供块级访问。  部署  很容易在现有体系结构中部署  需要更多的通信协议及集群文件系统配置方面的知识和经验  性能

需要通过网络共享  很高
提供专用的存储网络  数据访问
文件级别数据访问  块级数据访问  网络
dashDB local MPP 需要 POSIX 兼容的集群文件系统,该种方式采用 NFS  SAN 通信协议,包括 Fiber channel/iSCSI/FCoE  优势
适用易于使用及管理场景  适用高性能数据存储场景  示例
NAS storage appliances: EMC Isilon, Netapp, IBM              Elastic Storage Server (ESS)  Clustered filesystem required. Examples:
  • Cluster File System
  • GFS2
  • VERITAS Cluster File System (VxFS)
  • Generalized Parallel File System (GPFS)

我们也可以参考下述比较列表来选择采用 IBM Spectrum Scale、GFS2 不同的集群文件系统:
表 3. IBM Spectrum Scale 同          GFS2 的比较
IBM Spectrum                ScaleGPFSGFS2 概述  IBM Spectrum Scale              是一个文件系统,用于在多台机器之间分布及管理数据,它广泛用于高性能计算及大规模数据存储环境  Red Hat Global File System 2 (GFS2)包含于 Red Hat Resilient              Storage Add-On,是 Linux 集群的共享文件系统。GFS2 允许多个节点并发访问同一个共享块存储设备  集群大小  支持 16,384 节点  Red Hat 验证最多支持 16 个节点  数据单元  块大小 256 KB  块大小 4 KB  快照能力  IBM Spectrum Scale 高效且易于管理。它提供丰富的数据管理工具用于卷管理,特别是数据备份及恢复  需要附加组件来实现数据备份及恢复
本次 dashDB Local MPP 安装示例,我们使用了一个 Virtual SAN 共享存储,分配了 200GB 空间;每台主机安装了 IBM Spectrum Scale        (GPFS 4.1. 1.11)并挂接在/mnt/clusterfs 目录上。
网络要求
  • 确认在集群环境下的所有节点都在每个节点的/etc/hosts 文件中已经定义。本次示例中,我们使用了 3 台 Linux 服务器,每个节点的/etc/hosts          文件如下所示:
1
2
3
4
5
/etc/hosts
127.0.0.1 localhost.localdomain localhost
192.168.0.2 i-8t7n6xp2 i-8t7n6xp2
192.168.0.3 i-oisebqqf i-oisebqqf
192.168.0.4 i-si5oq07a i-si5oq07a




确认下述端口未被占用:
  • 60000-60024, for database FCM (60006 - 60007 for HADR, if you want to use it)
  • 25000-25999, for Apache Spark
  • 50022, for SSH/container OS
  • 50001, for database connection with SSL
  • 50000, for database connection without SSL
  • 9929, for communication tests
  • 9300, for web console status
  • 8443, for web console HTTPS
  • 5000, for System Manager
  • 389, for LDAP
  • 22, for SSH/host OS
可以使用下述命令来检查上述端口是否可用:
1
docker exec -it dashDB comm_test




  • 确认 IPv4 forwarding 被激活:
本次示例,我们采用 CentOS 7,可以执行下述命令:
1
2
3
4
在/etc/sysctl.conf 文件中添加:<br>
net.ipv4.ip_forward=1<br>
并执行命令:<br>
systemctl restart network

返回列表