Board logo

标题: Watson Explorer 实战操作,第 1 部分 如何构建一个内容分析集合-4 [打印本页]

作者: look_w    时间: 2018-3-17 12:02     标题: Watson Explorer 实战操作,第 1 部分 如何构建一个内容分析集合-4

实验五:解析和索引章节 1:创建一个索引字段对于内容分析集合,需要定义索引字段并指定每个索引字段属性。 在本实验习中,您将创建要定义的索引字段。 其中一些指标字段稍后定义为方面,并映射到文档中的 XML 字段。
图 36. 选择点击索引字段图 37. 存在的元数据索引字段点击创建一个索引字段
图 38. 创建索引字段详细然后再添加一下字段
图 39. 添加字段现在索引字段由自定义的索引字段和本机自带的索引字段组成。可以选择在最右边或窗口导出的索引字段定义。可以保存索引字段定义并将其导入不同的集合。
一些原生索引字段是必需的;提取的字段是取决于爬去的集合的类型。 例如,字段列表中,有一些字段图标(索引字段名称列中的 X 图标)并不表示索引字段(如 date 和 title)。        其他本地字段可以被删除,如 body,directory,extension,filesize,modifieddate。        未使用的索引字段占用空间在索引中,因此如果不使用索引,则可以将其删除。
章节 2:创建构面上面已经定义了索引字段,现在需要配置这些索引字段为构面,作为每个更容易被理解的构面名称。 在本节中,将创建一个构面树将索引字段关联到树上的面节点。
图 40. 创建一个“构面树”图 41. 更改构面路径现在已经定义了索引字段和构面树,然后需要将索引字段映射到每个文档中的标签。
图 42. 选择“解析选项”图 43. 更改线程数图 44. 选择“搜索服务器的内存”图 45. 选择“编辑集合设置”停止并启动解析和索引组件以使更改生效。
图 46. 选择“勇于解析和建立索引的内存”




欢迎光临 电子技术论坛_中国专业的电子工程师学习交流社区-中电网技术论坛 (http://bbs.eccn.com/) Powered by Discuz! 7.0.0