火车头文章采集方式

火车头文章采集方式

ID:10877224

大小:2.08 MB

页数:20页

时间:2018-07-08

火车头文章采集方式_第1页
火车头文章采集方式_第2页
火车头文章采集方式_第3页
火车头文章采集方式_第4页
火车头文章采集方式_第5页
资源描述:

《火车头文章采集方式》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、在你所需要的类目下,新建一个站点,或者是任务点击先导添加然后进入网址添加通过百度找到最适合的医院网址找到该网址所需要的文章列表页添加网址后点击尾页添加此网址将狂出部分添加为通配符在此处用英文输入格式下添加实际采集页数填写好后点击添加添加好后点击完成然后转到该网页的文章列表页中的源代码找寻类似于红框中内的代码利用查找功能确认此代码为独一无二的代码,无重复,并且在需要采集的文章列表前将头部代码添加在这里在到源文件中找寻文章列表页尾部的代码此为列表页文章底部在此底部找寻无重复代码同样通过查找方式确认然后填写到以上信息确认好后,点击“点击开始

2、测试网址采集”采集网址时出现红框内的小记号才算采集成功http://user.qzone.qq.com/1484954386随意点开红框内任意一个网址,进行文章内容设定双击网址进入然后点击测试文章内容就会出现双击内容进行内容设定进入文章内容也查找源代码查询文章前部代码,及文章尾部代码然后点击确定然后再次点击测试,查看是否成功排除其他代码得到的结果是这样的再次点击内容,进行内容替换,比如说替换医院名称,地区名称然后点击保存文档保存到需要保存的网盘里设定好后,点击保存设定好后可以直接转跳到了首页然后点击你之前设定的任务,点击开始,开始任务

3、采集然后等待文章采集文章采集完成后会出现类似这样的提示然后大家就可以关闭火车头,直接去所保存的文档下找寻文章里

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。