欢迎来到天天文库
浏览记录
ID:28505340
大小:407.26 KB
页数:7页
时间:2018-12-10
《八爪鱼采集器提取数据-找不到时如何处理.docx》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、八爪鱼采集器提取数据-找不到时如何处理八爪鱼提取字段时,有找不到时如何处理的选项。如下图:八爪鱼提取数据找不到时如何处理-图1下面介绍如何设置找不到字段时的操作:步骤一、点击需要设置的字段名称→自定义数据字段→自定义定位元素方式八爪鱼提取数据找不到时如何处理-图2八爪鱼提取数据找不到时如何处理-图3进入自定义定位元素方式后,我们可以看到下图中红框内,有找不到时如何处理的三个选项,分为:使用默认值、该字段留空以及该步骤所有字段留空。八爪鱼提取数据找不到时如何处理-图4这里为了方便演示,我们修改一下元素匹配的Xpath,这
2、样八爪鱼就抓取不到原来的字段了。八爪鱼提取数据找不到时如何处理-图5八爪鱼提取数据找不到时如何处理-图6由于我们在标题处选择的是找不到时该字段留空,所以修改Xpath后,标题处提取到的数据为空。八爪鱼提取数据找不到时如何处理-图7我们同样修改类型和评分处的Xpath看一下其余两项效果。评分处的使用默认值设置提取不到内容容时出现默认值,默认值设置如下:八爪鱼提取数据找不到时如何处理-图8步骤二:保存并启动八爪鱼提取数据找不到时如何处理-图9可以看到弹出了采集错误报告,当前网页三条数据均未采集到信息八爪鱼提取数据找不到时如
3、何处理-图10此处是因为类型中,找不到字段时该步骤所有字段留空,导致标题、类型、评分、上映年份以及时间均为空值,当八爪鱼一条信息采集不到任何一个字段时便会弹出错误提醒,我们可以查看采集错误报告看到错误类型来进行修改。八爪鱼提取数据找不到时如何处理-图11如上图,我们设置类型采集不到数据时该字段留空,保存并运行后,可以看到:八爪鱼提取数据找不到时如何处理-图12标题与类型因为我们设置的该字段留空,所以未显示有任何内容;八爪鱼因为我们没有设置该步骤所有字段留空,所以也没有弹出错误报告;评分处因为我们设置使用默认值,默认值为
4、找不到数据*——*,所以弹出如图所示的内容。这就是找不到数据时的三种办法,其中该字段留空可以使我们在结果中明显的看到哪里有数据没采集到;该步骤所有字段留空则会使一个字段找不到数据时,便忽略该信息所有字段,相当于跳过该条信息的采集;使用默认值可以让你在找不到数据时默认填写一个字段,来补充没有采集到的内容。相关采集教程:天猫商品信息采集新浪微博数据采集1688热门商品采集八爪鱼——70万用户选择的网页数据采集器。1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2分钟即可快速入门
5、。2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群24*7不间断运行,不用担心IP被封,网络中断。4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如私有云),满足高端付费企业用户的需要。
此文档下载收益归作者所有