首页
|
新闻
|
新品
|
文库
|
方案
|
视频
|
下载
|
商城
|
开发板
|
数据中心
|
座谈新版
|
培训
|
工具
|
博客
|
论坛
|
百科
|
GEC
|
活动
|
主题月
|
电子展
注册
登录
论坛
博客
搜索
帮助
导航
默认风格
uchome
discuz6
GreenM
»
MCU 单片机技术
»
PowerPC
» Watson Explorer 实战操作,第 1 部分 如何构建一个内容分析集合-3
返回列表
回复
发帖
发新话题
发布投票
发布悬赏
发布辩论
发布活动
发布视频
发布商品
Watson Explorer 实战操作,第 1 部分 如何构建一个内容分析集合-3
发短消息
加为好友
look_w
当前离线
UID
1066743
帖子
8283
精华
0
积分
4142
阅读权限
90
在线时间
233 小时
注册时间
2017-6-23
最后登录
2019-5-18
论坛元老
UID
1066743
1
#
打印
字体大小:
t
T
look_w
发表于 2018-3-17 12:01
|
只看该作者
Watson Explorer 实战操作,第 1 部分 如何构建一个内容分析集合-3
实验四:搜寻和导入章节 1:创建一个爬虫
集合面板中有"搜寻和导入","解析和索引","搜索和内容分析"三个面板
单击集合"2017 上市公司半年报分析"面板,扩展子面板
在"解析和索引"窗格中,显示状态消息"正在等待",左边的红色方块状态消息是停止图标。 单击停止图标(红色方块)停止解析和索引过程。解析和索引状态消息已更改为已停止。 停止图标(红色正方形)已更改为绿色三角形(开始图标)。
在搜寻和导入窗格中,新增一个"搜寻器"
图 30. 新增一个搜寻器
在"搜寻器类型"选择 Windows 文件系统,然后单击下一步。
图 31. 选择“Windows 文件系统”类型
在 windows 文件系统中完成一下步骤
命名为 Windows 文件系统搜寻器 -财务报表
向下滚动窗口以查看各种高级选项。输入描述,10000 文档,完全抓取。
更改启动爬网程序会话选项以启动完全搜寻。这将确保如果更改文档的解析方式则会重新爬行所有内容。当集合更新完成,将从新爬去新增内容和修改内容。
图 32. 属性填写细节
我们将所有的 2017 年上市公司的 PDF 文档放在 C:\Data\Fianial 目录下面,如图
图 33. 找到目录下数据
将该目录设置为爬去目录,
图 34. 设置目录
点击完成创建此集合,返回首页,点击绿色三角箭头,启动爬虫
图 35. 启动爬虫
收藏
分享
评分
回复
引用
订阅
TOP
返回列表
FPGA/CPLD可编程逻辑
数字电路
电商论坛
Pine A64
资料下载
方案分享
FAQ
行业应用
消费电子
便携式设备
医疗电子
汽车电子
工业控制
热门技术
智能可穿戴
3D打印
智能家居
综合设计
示波器技术
存储器
电子制造
计算机和外设
软件开发
分立器件
传感器技术
无源元件
资料共享
PCB综合技术
综合技术交流
EDA
MCU 单片机技术
ST MCU
Freescale MCU
NXP MCU
新唐 MCU
MIPS
X86
ARM
PowerPC
DSP技术
嵌入式技术
FPGA/CPLD可编程逻辑
模拟电路
数字电路
富士通半导体FRAM 铁电存储器“免费样片”使用心得
电源与功率管理
LED技术
测试测量
通信技术
3G
无线技术
微波在线
综合交流区
职场驿站
活动专区
在线座谈交流区
紧缺人才培训课程交流区
意见和建议