首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

Bluemix 上的 Analytics for Hadoop-使用 BigSheets 探究数据(1)

Bluemix 上的 Analytics for Hadoop-使用 BigSheets 探究数据(1)

本教程将使用 BigSheets 分析和检查大数据,这个基于浏览器、类似电子表格的工具可以建模、过滤、组合和绘制从多个来源收集的数据,所有 BigInsights        版本都提供了该工具。
现在我们来分析数据。
创建主要工作簿
  • 在示例数据目录中(在  中创建),选择您上传的 blogs-data.txt 文件。在右侧窗口中可以看到此数据的原始快照视图。
  • 选择 Sheet 单选钮,该按钮可以在数据的原始快照上方找到。


    在窗口的 Preview 区域中,可以看到数据未正确显示。它具有 JSON(JavaScript Object Notation,JavaScript            对象表示法)数组结构。
  • 需要使用一个读取器将数据映射到电子表格格式。
    • 单击 Edit 图标。
    • 从 “Select a reader” 下拉列表中选择 JSON Array
    • 然后单击绿色的勾号。


      您会立即在 Preview 区域中看到数据映射到这个类似电子表格的界面的列和行。
    • 因为数据列超出了查看空间,所以应单击 Fit column(s)。Preview 区域中显示了前 8                  列。备注:根据 Web 浏览器窗口的大小,您可能需要滚动才能看到 Fit column(s) 选项。
    • 单击 Save as Master Workbook
    • Name 字段中,输入 MyWatsonBlogs。
    • Description 字段中,输入 Watson blog data from                blogs-data.txt,然后单击 Save
  • 单击窗口顶部的痕迹中的 Workbooks 链接。您会转到 BigSheets 选项卡,现在可看到新的主要工作簿          MyWatsonBlogs。
  • 单击 New Workbook
  • Name 字段中,输入 MyWatsonNews。
  • Description 字段中,输入 Watson news feed data from            news-data.txt。
  • 在 File 下,导航到 /user/[userID]/bi_sample_data 目录并选择 news-data.txt 文件。窗口右侧显示了文件名和内容。此数据也为          JSON Array 格式。
  • 单击 Edit 图标。
  • 从下拉列表中选择 JSON Array,然后单击绿色勾号来应用该读取器。
  • 因为数据列超出了查看空间,所以单击 Fit column(s)。Preview 区域中显示了前 8 列。
  • 要保存主要工作簿,可以单击屏幕右下角的绿色勾号。


    备注:根据 Web 浏览器窗口的大小,可能需要滚动才能看到绿色勾号。
    您将转到 BigSheets            选项卡,现在可以看到新工作簿 MyWatsonNews。
  • 单击 Workbooks 链接查看两个新的主要工作簿。
返回列表