标题:
Bluemix 上的 Analytics for Hadoop-使用 BigSheets 探究数据(1)
[打印本页]
作者:
look_w
时间:
2018-6-23 08:30
标题:
Bluemix 上的 Analytics for Hadoop-使用 BigSheets 探究数据(1)
本教程将使用 BigSheets 分析和检查大数据,这个基于浏览器、类似电子表格的工具可以建模、过滤、组合和绘制从多个来源收集的数据,所有 BigInsights 版本都提供了该工具。
现在我们来分析数据。
创建主要工作簿
在示例数据目录中(在 中创建),选择您上传的 blogs-data.txt 文件。在右侧窗口中可以看到此数据的原始快照视图。
选择
Sheet
单选钮,该按钮可以在数据的原始快照上方找到。
在窗口的 Preview 区域中,可以看到数据未正确显示。它具有 JSON(JavaScript Object Notation,JavaScript 对象表示法)数组结构。
需要使用一个读取器将数据映射到电子表格格式。
单击
Edit
图标。
从 “Select a reader” 下拉列表中选择
JSON Array
。
然后单击绿色的勾号。
您会立即在 Preview 区域中看到数据映射到这个类似电子表格的界面的列和行。
因为数据列超出了查看空间,所以应单击
Fit column(s)
。Preview 区域中显示了前 8 列。
备注
:根据 Web 浏览器窗口的大小,您可能需要滚动才能看到 Fit column(s) 选项。
单击
Save as Master Workbook
。
在
Name
字段中,输入 MyWatsonBlogs。
在
Description
字段中,输入 Watson blog data from blogs-data.txt,然后单击
Save
。
单击窗口顶部的痕迹中的
Workbooks
链接。您会转到 BigSheets 选项卡,现在可看到新的主要工作簿 MyWatsonBlogs。
单击
New Workbook
。
在
Name
字段中,输入 MyWatsonNews。
在
Description
字段中,输入 Watson news feed data from news-data.txt。
在 File 下,导航到 /user/[userID]/bi_sample_data 目录并选择 news-data.txt 文件。窗口右侧显示了文件名和内容。此数据也为 JSON Array 格式。
单击
Edit
图标。
从下拉列表中选择
JSON Array
,然后单击绿色勾号来应用该读取器。
因为数据列超出了查看空间,所以单击
Fit column(s)
。Preview 区域中显示了前 8 列。
要保存主要工作簿,可以单击屏幕右下角的绿色勾号。
备注
:根据 Web 浏览器窗口的大小,可能需要滚动才能看到绿色勾号。
您将转到 BigSheets 选项卡,现在可以看到新工作簿 MyWatsonNews。
单击
Workbooks
链接查看两个新的主要工作簿。
欢迎光临 电子技术论坛_中国专业的电子工程师学习交流社区-中电网技术论坛 (http://bbs.eccn.com/)
Powered by Discuz! 7.0.0