完成本文的前提条件要从本文获得最大的收获并使用示例代码,需要拥有以下主题的基本知识,并能访问以下软件环境:
- SPSS Modeler
- PureData System for Analytics (Netezza)
- DB2 for LUW
- 熟悉客户数据管理并理解客户隔离
- 能够访问
要将示例数据加载到您机器上:
- 将文件 Customer Segmentation.zip 中的内容解压到 C 盘。确保该文件夹中存在以下文件:
- CUSTOMER - Set2.CSV
- CUSTOMER.CSV
- Customer_Segmentation.cpj
- Data_Preparation_Customer_Segmentation.str
- Data_Understanding_Customer_Segmentation.str
- Deployment_Customer Segmentation.str
- Modeling_Customer_Segmentation.str
- 为 DB2 数据库创建 ODBC 系统数据来源名称 (DSN) 条目。
- 为 Netezza 数据库创建 ODBC DSN 条目。
了解业务需求一般的细分流程目前对大量不同的数据行不通。因此,您需要获得一种分析方法,从大型数据集中派生细分类别和组。例如,一个组可能包含更可能购买产品的客户。另一个组可能包含来自非营利组织的客户。
客户细分 是将客户群划分为具有类似特征的个体分组,使企业能够针对这些特定的客户组来有效地分配市场资源。
识别相关数据理解和识别正确的数据集,对任何具有庞大的数据集的项目都至关重要。SPSS Modeler 工作台为您提供了一种更容易、更快速的方式来识别要使用的数据。
本文将介绍如何使用来自两个来源的数据,用于细分分析:DB2 中的一个数据库表和一个平面文件。
从数据库读取数据要从数据库读取数据,最初需要建立一个 ODBC 连接。可从 DB 节点使用这些 ODBC 连接和访问数据库。
图 1. 从数据库读取数据 具体地讲,可对表中的 9 个字段(如下所示)进行排序,并用于生成全尺寸的图表和各种各样的数据准备节点。
图 2. 来自数据审计节点的 9 个字段
从平面文件读取要从平面文件读取数据,可以使用 SPSS 中提供的固定文件/可变文件节点。
图 3. 从平面文件读取 上面以红色突出显示的 Statistics 节点提供了如下所示的各个字段和字段间的关联的摘要统计数据。
图 4. 各个字段和关联的摘要统计数据 客户可基于多个因素而分类:年龄、性别、兴趣、消费习惯等。重要的需求是使用可用的数据来理解和识别客户有何关联。 |