ID:12409336
大小:184.50 KB
页数:8页
时间:2018-07-16
8、作为边界终点。缩略图采集规则:这个是用来采集列表页缩略图用的,留空即可。采集登陆网站:这个是针对需要登陆后才能访问的内容设计的,cookie的获取,可以使用ieHTTPHeaders获取,或者用火车头采集器获取。可以参考相应工具。然后把获取的cookie粘贴到使用已有的COOKIE后面的框框里即可。B内容规则:内容规则这里看起来比较复杂,其实也很简单,为了便于说明,我们只采集标题、内容两个字段。采集内容网址:http://news.sina.com.cn/c/2009-05-20/1510178
此文档下载收益归作者所有