首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

如何从 Web 浏览会话数据中生成表、图形、交叉表和统计数据(1)

如何从 Web 浏览会话数据中生成表、图形、交叉表和统计数据(1)

实现商业智能的统计过程商业智能 (BI) 提供了企业组件的不同执行情况的洞察:
  • 您如何接近您的潜在客户?
  • 影响业务绩效的因素是什么?
  • 如何预测实施策略和想法的结果,以带来改进。
您通过从与您的业务直接或间接相关的原始数据中提取高级业务信息来获取此洞察。
考虑一个在线业务场景的示例。您有大量产品要使用许多 Web 资源来推广,比如博客、按点击付费 (PPC) 广告、登录页面和您的公司网站。
阅读您博客的潜在客户可能进一步浏览您的登录页面,然后注册或购买一款产品。PPC 广告也会将用户引导至登录页面。
什么是登录页面?登录页面是针对一种特定用途而设计的网页,比如一场销售特定产品的市场营销活动。每个登录页面都会将用户引导至您网站上的某个特定的产品页。感兴趣的用户可从该页面购买该产品。登录页面通常不同于公司网站,公司网站会介绍该公司各种各样的活动、产品和服务。
通过所有这些营销手段,您的目的是吸引潜在客户以各种各样的方式访问您的网站。您网站的流量很大,但如何评估您的营销工具的表现?
IBM SPSS Statistics 可帮助回答您吸引尽可能多的用户注册和购买的战略,如以下问题:
  • 与您的 PPC 活动相比,有多少流量是从博客引到您站点的?
  • 您的博客如何将潜在客户推向您的登录页面?
  • 有多少用户在访问了登录页面后注册和购买了产品?
  • 您的 PPC 活动是否具有不错的 ROI?
BI 处理原始数据并提取高级业务信息来回答这些问题。本系列将介绍能够找到这些问题的答案的 SPSS Statistics 特性。
Web 浏览会话数据对业务而言,一部分非常重要的原始形式的数据就是 Web 浏览会话数据。大多数 Web 应用程序都会尝试获取此数据。
用户会话数据可识别用户在一个会话期间访问了哪些资源。例如,一个用户会话从用户到达您的一篇博客时开始,到用户注册或离开时结束。会话数据包含用户采取的到达您的营销资源的路径信息。
清单 1 是从一个示例会话中提取的原始形式的数据。本文整篇文章都会使用这个示例会话数据。示例数据可从本文的下载部分获得。
出于本文中的测试用途,示例数据量少于 200 个会话。在具有正常的 PPC                营销活动、博客、登录页面和公司网站的实际应用中,每小时可能生成数十万个会话。一年的会话数据可分类为大数据。
清单 1.                原始会话数据示例
1
2
3
4
5
6
7
8
9
10
11
12
PPC Blog    LandingPage LPType  Signup  Login   Purchase    SessionTime
0   2   1       4   0   0   1       94
3   0   3       2   0   0   0       16
4   0   2       5   1   0   0       29
1   0   5       5   1   0   0       19
0   1   4       3   0   0   1       103
5   0   1       4   1   0   0       16
0   4   3       2   1   0   1       109
2   0   4       3   1   0   0       8
0   3   5       5   1   0   1       87
5   0   1       4   0   0   0       16
0   0   0       0   0   1   1       136




清单 1 中的每行数据表示一个用户会话。本文的统计分析中使用的示例会话数据就是按这种方式进行组织的:
  • 第一个会话在 PPC 列中的值为 0,这意味着此会话没有从任何 PPC 营销活动开始。PPC 营销活动编号 1 到 5 表示 5 场                    PPC 营销活动。
  • 第二列是 Blog,而且它在第一行中的值为 2,这意味着用户通过阅读编号为 2 的博客来开始浏览会话。博客编号 1 到 5 表示 5                    篇博客。第 2 列中的 0 表示没有任何博客活动的会话。
  • 第三列 LandingPage 也使用了 0 到 5 的值。0 表示没有登录页面时的会话,1 到 5 表示登录页面 1 到                    5。
  • 第四列使用了 1 到 5 的值来标识登录页面的类型。1 表示一个具有最少的图形和更多描述性文本的登录页面。而 5                    表示一个包含大量图形和最少文本的登录页面。
  • 第五列是 Signup。值 1 表示用户已注册,0 表示用户在此会话期间没有注册。
  • 第六列是 Purchase。如果用户购买了一款产品,那么第六列中的值为 1。
  • 第七列是 Login。以前注册的用户再次访问网站时就会产生一个登录会话。这种类型的会话不会从博客或 PPC 营销活动开始。
  • 最后的第八列是总会话时间。总会话时间是从用户访问第一个资源(单击一个 PPC 广告)直到最后一个操作(用户注册)所经历的时间。
返回列表