Board logo

标题: IBM Cognos 11 连接 Hadoop 的最佳实践-1 [打印本页]

作者: look_w    时间: 2018-2-21 14:19     标题: IBM Cognos 11 连接 Hadoop 的最佳实践-1

大数据标志着业务分析的新时代到来,各商业组织现在有机会就数据在容量、速度和多样性的传统处理能力不足问题上作出更加明智的决策。IBM                具有得天独厚的优势, 可以提供全面的技术和服务, 从大数据中吸取可操作的洞察力,通过与如 IBM InfoSphere BigInsights                为代表的 Hadoop 技术互链, IBM Cognos 商业智能现在可以轻松访问非结构化源数据,                从而使业务分析人员能够接触到大量非结构化数据中发现的关键洞察。
Hadoop 是一个分布式系统基础架构,由 Apache                基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。是一个可以更容易开发和运行处理大规模数据的软件平台。Hadoop                实现了一个分布式文件系统(Hadoop Distributed File System),简称 HDFS。HDFS                有着高容错性(fault-tolerent)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high                throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。简而言之, Hadoop                是一个用于操作大型数据集的分布式平台。它建立了容错能力, 这使得它吸引了停机时间可能影响业务流程的组织。Cognos 是一种商业智能工具,                它允许用户浏览和报告数据。然而, Hadoop 并没有像其它技术所评论的那样, 自己进行即席查询。这里只有一个 Hadoop                项目可以做到这点——Hive。开发人员已经发布了 ODBC 连接器来访问配置单元数据库 (这仅仅是您的 Hadoop 数据的数据仓库视图,                可以使用称为 Hive QL 的类似 SQL 的语言进行查询)。由于 Cognos 可以从 ODBC 数据库中提取数据, 因此 Cognos                可以通过配置单元从 Hadoop 提取数据。
在最新的 Cognos Analytics 11 环境中使用 Hadoop 的另一种方法是使用文本文件 (如 CSV) 传输数据。Hadoop                可以生成一个数据文件, 然后可以将其导入到 Cognos 中。
然而, 为什么要使用 Hadoop 来连接 Cognos 呢?举个例子,我使用 Hadoop                的两个应用程序是库存预测和现金流量/预算,如果您正在尝试执行对数十万 SKU 的常规预测, 则 Hadoop                是一个非常好的工具。另外,如果您试图执行蒙特卡洛模拟超过 1000 预算项目, Hadoop 也是非常棒的选择。只需从数据仓库导入数据, 运行您的                Hadoop 作业, 然后将生成的 CSV 文件导入 Cognos,一切就完成了。
不过要小心, Hadoop 不是万能药。有时,传统的 SQL 和你的编程语言的选择效果是一样好的,或者更好,因为 Hadoop                带有学习曲线和资源需求。你可以通过下载 Hortonworks 的沙箱学习:它是一个预配置的虚拟机, 在 VMware                中运行。所以你不必安装或配置任何东西。
另外,IBM InfoSphere BigInsights 为 IBM 官方的 Hadoop 产品,本文将用该产品作为 Hadoop                的连接对象,并且,将通过 Cognos 最新的 Hadoop 连接能力说明,来为 Cognos 的大数据使用作指导。
IBM Cognos 11                新特性首先,Cognos 升级到 Cognos 11 版本有很多重大的变化,名称也由 Cognos Business Intelligence 变更为                Cognos Analytics,从而更加强调分析能力,比如时下流行的敏捷 BI,大数据可视化,协同等能力。即很好的保持了 Cognos                以往稳健的数据工程学体系,来保证用户对于数据的信任,另一方面也提供了简洁的界面来增强用户的使用体验,并且支持云部署。特别是引入的协同能力能使得组织能够轻松地在成百上千的用户和他们的生态系统中共享知识,并为驱动业务结果的决策和操作提供动力,另外,新的                Cognos Analytics 同时提供企业级 BI+敏捷 BI 能力,包括让业务分析师可以及时的拖动数据来快速的搭建分析视图,下面新的                Cognos Analytics 的详细新功能介绍:
提供用户端分析
提供分析和内容的创作
提供建模能力
这些特点让 Cognos 11 的使用体验充满了期待,




欢迎光临 电子技术论坛_中国专业的电子工程师学习交流社区-中电网技术论坛 (http://bbs.eccn.com/) Powered by Discuz! 7.0.0