使用八爪鱼v7采集知乎发现话题信息

使用八爪鱼v7采集知乎发现话题信息

ID:36576600

大小:1.61 MB

页数:17页

时间:2019-05-12

使用八爪鱼v7采集知乎发现话题信息_第1页
使用八爪鱼v7采集知乎发现话题信息_第2页
使用八爪鱼v7采集知乎发现话题信息_第3页
使用八爪鱼v7采集知乎发现话题信息_第4页
使用八爪鱼v7采集知乎发现话题信息_第5页
资源描述:

《使用八爪鱼v7采集知乎发现话题信息》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息本文介绍使用八爪鱼采集知乎-发现-话题为例采集网站:https://www.zhihu.com/#signin使用功能点:l八爪鱼7.0教程——AJAX滚动教程http://www.bazhuayu.com/tutorial/ajgd_7.aspx?t=1lcookie登陆方法(7.0版本)http://www.bazhuayu.com/tutorial/cookie70.aspx?t=1相关采集教程:新浪微

2、博数据采集豆瓣电影短评采集搜狗微信文章采集步骤1:创建采集任务1)进入主界面,选择“自定义模式”八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图12)将要采集的网址复制粘贴到网站输入框中,点击“保存网址”八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图2步骤2:登录知乎1)系统自动打开网页,进入知乎登录页面。系统默认停留在扫描二维码登录页面。点击“使用密码登录”,选择“更多操作”八爪鱼·云采集服务平台www.b

3、azhuayu.com使用八爪鱼v7采集知乎发现话题的信息图32)选择“点击该元素”,进入“使用密码登录”页面八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图43)依次点击账号和密码输入框,输入账号和密码(直接输入,可忽视操作提示框)八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图54)点击“登录”按钮,选择“点击该按钮”八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息

4、图65)在页面右上角,打开“流程”,以展现出“流程设计器”和“定制当前操作”两个板块。系统会自动登录知乎。再次选中“打开网页”步骤,打开“高级选项”,打开“缓存设置”,勾选“打开网页时使用指定Cookie”。八爪鱼会记住这个cookie状态,下次打开这个页面的时候,就会以登陆之后的状态打开八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图7注意:由于cookie是有生命周期的,这个周期多长时间取决于采集的网站。如果cookie到期了,就需要再重新获取一次登

5、陆之后的cookie。另外,如果需要切换账号,可以勾选“打开浏览器前清理缓存”,然后再取消cookie,重新设置其他账号即可。步骤3:设置Ajax下拉加载1)点击“发现”按钮,在操作提示框中,选择“点击该链接”八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图81)系统自动挡进入“发现”栏目下的话题页面。我们发现,下拉页面,会出现“加载中”的字样,等待约2秒,会有新的数据加载出来。经过约40次下拉加载,页面达到最底部八爪鱼·云采集服务平台www.bazhu

6、ayu.com使用八爪鱼v7采集知乎发现话题的信息图9“点击元素”步骤涉及Ajax下拉加载。打开“高级选项”,勾选“页面加载完成后向下滚动”,设置滚动次数为“40次”,每次间隔“2秒”,滚动方式为“直接滚动到底部”,最后点击“确定”八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图10注意,这里的滚动次数、间隔时间,需要针对网站进行设置,可根据相关功能点教程进行学习步骤4:创建列表循环1)移动鼠标,选中页面里的第一条话题链接。选中后,系统会自动识别页面里的

7、其他相似链接。在右侧操作提示框中,选择“选中全部”八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图112)选择“采集以下链接地址”八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图122)再次选中页面里的第一条话题链接,选择“采集该链接的文本”使用八爪鱼v7采集知乎发现话题的信息图133)选择“启动本地采集”八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图14步骤5:数

8、据采集及导出1)采集完成后,会跳出提示,选择“导出数据”。选择“合适的导出方式”,将采集好的数据导出八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图152)这里我们选择excel作为导出为格式,数据导出后如下图八爪鱼·云采集服务平台www.bazhuayu.com使用八爪鱼v7采集知乎发现话题的信息图16八爪鱼——70万用户选择的网页数据采集器。1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。