首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

Watson Explorer 实战操作,第 1 部分 如何构建一个内容分析集合-5

Watson Explorer 实战操作,第 1 部分 如何构建一个内容分析集合-5

实验六:启动爬虫,部署分析资源,重建索引在实验中,将执行启动解析器和搜索服务器所需爬虫程序。该抓取工具从配置的子目录中提取文档。 解析器解析并索引将数据抓取到 tokens        中,并应用上述部分中定义的搜索和定义规则。
  • 在 2017 上市公式半年报分析中,完成一下操作
单击"搜索和导入"窗格中的"搜索引擎"框, 单击 Windows 文件系统的绿色三角形图标(启动此爬虫程序)抓取工具右侧显示的百分比完成显示状态。
图 47. 监控抓取进度
  • 爬虫程序启动(状态消息正在爬网)后,单击图标,监视此抓取工具抓取的内容的详细信息和统计信息。观察爬行器的进度。
图 48. 观察爬行器的进度单击定期刷新,等待窗口刷新,看到响应之前,可能需要缓慢的几次点击。
注意:如果对构面树进行了更改,则需要重新部署分析资源并重新构建索引。单击"分析资源"框扩展显示。单击绿色三角形(部署分析资源)以重新部署分析资源。重新部署完成后,从"详细信息"框中,单击绿色三角形(重建索引)重建索引。        在消息中,索引重建未进行中。 您可以重新启动完整的索引构建。要启动索引的完整重建吗?,请单击确定。
当重建索引消息 100%停止时,再次单击"详细信息"框以折叠显示。默认情况下,搜索和内容分析过程应该运行。 如果没有运行,请单击开始图标(绿色右对角三角形)启动搜索服务器。        停止任何其他集合运行。
实验七:验证内容分析工具中已更改的内容
  • 进入 Watson Explorer Content Analytics 界面
  • 在分析界面完成以下操作
1. 验证 2017 上市公司半年报分析的导航栏
图 49. 导航栏2. 如果 2017 上市公司半年报分析(集合)链接,请选择 2017 上市公司半年报分析,然后单击保存。
图 50. 选择“2017          上市公司半年报分析”3. 点击构面按钮,再点击左边的自带的词性标注,显示如下
图 51. 词性标注4. 点击创建资产负债表等自定的构面,会发现目前后面内容为空
图 52. 检查创建的资产负债表等自定义构面注意:如果发现有错误,则需要更正错误,重新部署分析资源并重建索引。
实验八:创建一个用户字典实验五已经创建了一个构面,但是到目前为止,构面还没有任何内容。需要创建一个用户字典来分类您平时关心的内容
  • 从分析资源中进入构面树
图 53. 进入构面树先配置资产负债表的用户字典,配置内容:
图 54. 配置用户字典
  • 重新部署分析资源,点击如下图的绿色三角箭头
图 55. 选择“分析资源”重建索引,点击如下图所示的重建索引绿色三角符号。该操作如果文件数量较多的化,可能会话费比较多的时间。
图 56. 重建索引检验:进入分析页面,点击构面—最左边的资产负债表,右边构面不再为空则说明刚刚的用户字典已经生效了,如下图:
图 57. 进入分析页面
返回列表