欢迎来到天天文库
浏览记录
ID:21659077
大小:356.40 KB
页数:9页
时间:2018-10-23
《八爪鱼采集器v7相对xpath教程》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、八爪鱼采集器v7相对Xpath教程本教程适用于对八爪鱼自定义模式有定操作基础,学习过XPath基础教程,能看懂并书写简单的XPath路径的小伙伴。建议看之前,先掌握基础操作:Xpath入门(上)Xpath入门(下)XPath论坛详细教程:http://bbs.bazhuayu.com/showtopic.aspx?topicid=2559XPathW3C系统教程:http://www.w3school.com.cn/xpath/index.asp相对Xpath是什么?在Xpath语法中,元素定位主要有两种方式。第一种:通过绝对路径做定位(定位较为死板)By.xpa
2、th("html/body/div/form/input")第二种:通过相对路径做定位,两个斜杠代表相对路径By.xpath("//input//div")以下为一个相对Xpath示例。网址:http://zu.wuhan.fang.com/cities.aspx需求:采集整个城市列表和其所对应的省份相对Xpath-图1步骤1:分析网页需求1)从源码中可发现城市和省份并不是同一类型的元素,省份所在位置对城市而言有个相对位置2)此外,如果将城市和省份一同建立循环,也不便获取到省份与城市一一对应的数据样式。故,此处我们以城市建立循环相对Xpath-图2步骤2:创建任务
3、,编辑规则1)以城市创建循环后,直接进行提取相对Xpath-图32)手动执行到其他城市时,发现虽然城市信息能够准确提取到,但是省份信息出现错乱。这是由于省份的Xpath设置不对,未能正确产生联动,使之和城市相关联相对Xpath-图43)红框中为自动生成的Xpath(//DIV[@class='outCont']/UL[1]/LI[1]/STRONG[1]),其每次固定定位到“直辖市”相对Xpath-图5步骤3:设置相对Xpath根据需求,省份要和城市相对应,所以在采集城市时,省份的Xpath要相对于城市而发生变化,形成联动而不是固定到某一个元素。1)首先,我们回到
4、循环中找到循环列表的Xpath(.//*[@id='c02']/ul/li/a),复制该Xpath到火狐浏览器中相对Xpath-图62)在火狐浏览器中,写出“省份”相对于“城市”列表(.//*[@id='c02']/ul/li/a)所对应的Xpath(/preceding-sibling::strong[1])。(Ps:以循环列表的Xpath为前缀,写出要采集字段的Xpath)相对Xpath-图73)在“省份”的元素定位方式中勾选上“相对Xpath”,然后在输入框中粘贴之前写下相对Xpath(/preceding-sibling::strong[1]),最后确定保
5、存相对Xpath-图84)手动执行检查验证,已能联动,正确提取到相应数据相对Xpath-图95)本地采集结果如下:相对Xpath-图10相关采集教程:京东商品信息采集美团商家信息采集房天下信息采集八爪鱼——70万用户选择的网页数据采集器。1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2分钟即可快速入门。2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群24*
6、7不间断运行,不用担心IP被封,网络中断。4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如私有云),满足高端付费企业用户的需要。
此文档下载收益归作者所有