访问模式在大数据解决方案中,有许多数据源,还有很多访问数据的方式,本节将介绍最常见的几种。
Web 和社交媒体访问模式Internet 是提供许多目前可以获得的洞察的数据源。在几乎所有分析中,都会用到 Web 和社交媒体,但获得这种数据需要不同的访问机制。
在所有数据源中,因为 Web 和社交媒体的多样性、速度和数量,所以 Web 和社交媒体是最为复杂的。网站大约有 40-50 个类别,每一个类别都需要使用不同的方式来访问数据。本节将列出这些类别,并介绍一些访问机制。从大数据的角度讲,高级的类别是商业站点、社交媒体站点,以及具有特定和通用组件的站点。有关的访问机制见图 3。如果需要的话,在完成预处理后,可将所访问的数据存储在数据存储中。
图 3. Web 和社交媒体访问需要执行以下步骤来访问 Web 媒体信息。
图 4. 大数据访问步骤非结构化数据存储中的 Web 媒体访问