借助 IBM 的顶级数据科学平台充分利用非结构化数据分析(1)
- UID
- 1066743
|
借助 IBM 的顶级数据科学平台充分利用非结构化数据分析(1)
什么是 Watson Explorer for Data Science Experience?Watson Explorer (WEX) 是一个 的搜索和内容挖掘平台,由 IBM 研究院建立,旨在为企业提供深层文本分析功能。Watson Explorer for Data Science Experience (DSX) 将 Watson Explorer 文本挖掘功能与 DSX 的功能紧密集成,用于实施数据科学家的工作流程,从而根据文本数据中隐藏的信息来制定出考虑周全的业务决策。
图 1 描述了数据科学家如何使用机器学习创建预测模型的典型工作流程。
图 1.创建预测模型的工作流程
在图 1 中,以上蓝框表示利用 Watson Explorer for Data Science Experience 增强的任务。绿框表示通过将 Watson Explorer 与 Data Science Experience 和平台上嵌入的工具(例如,SPSS Modeler 和 Notebook)相集成而增强的任务。
探索和理解数据Watson Explorer for Data Science Experience 将 Watson Explorer 专有的 Content Miner 技术与 DSX Local 的用户界面紧密集成起来。首先,数据科学家可以创建一个 Watson Explorer 集合,作为 DSX Local 资产。在图 2 中,我们创建了 Retail Voice of the Customer 集合。
图 2.Watson Explorer 集合作为 DSX Local 资产进行管理。
创建此集合后,可将文本数据从 DSX Local 数据集注入此集合。随后,数据科学家可以使用嵌入 DSX Local 用户界面的 Watson Explorer Content Miner,探索此集合中的文本数据。Content Miner 可通过统计评分方法(例如,文本数据中的关键字频率或关联)来直观显示信息。这种非常直观且易于操作的文本分析方法为数据科学家提供了快速系统化理解文本信息的途径,而无需分析大量非结构化数据。
图 3.DSX Local 中的 Watson Explorer Content Miner |
|
|
|
|
|