欢迎来到天天文库
浏览记录
ID:37973288
大小:828.56 KB
页数:10页
时间:2019-06-04
《火车头使用规范》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、火车头资源抓取制作规范一、电影院名称资源抓取A.安装火车头软件(直接将火车头的软件包解压到电脑的任意盘)B.打开火车头所在的文件夹,找到下图所示的图标并双击打开第一次打开会提示你是否更新,选择不更新C.在软件左侧界面中找到“任务列表树”,打开“自然语言组”文件夹,并选中“文法列表资源右击鼠标进入选择”选择“导入任务至该分组”D.将“豆瓣影院.ljobx固定文件”文件导入即可,如下图所示:E.文件导入完成后,会出现“豆瓣影院”任务F.对“豆瓣影院”进行“编辑任务”G.“编辑任务”详细设置第一步:采集网址规则在“起始网址”中选择“添加”点击“添加”后会出现下面窗口,选择“文本导入”进入“浏览
2、”在“浏览”中选择“豆瓣电影网址列表.txt固定文件”,然后打开“打开”后,选择“添加”,最后“完成”第二步:采集内容规则不用进行任何设置第三步:发布内容设置1.选择“方式二”2.“保存文件格式”设置为“所有记录保存为一个txt文件”3.“保存位置”可以自定义4.“文件模板”选择“保存格式.txt固定格式”H.将所有设置进行保存I.把三项全部选中,之后选中“豆瓣影院”右击,便可“开始任务运行”注意:从第二次开始,每次“开始任务运行”之前都要“清空任务所有采集数据”和“清空该任务网址库”,之后再“开始任务运行”一、爱奇艺资源抓取A.安装火车头软件(直接将火车头的软件包解压到电脑的任意盘)B
3、.打开火车头所在的文件夹,找到下图所示的图标并双击打开第一次打开会提示你是否更新,选择不更新i.C.在软件左侧界面中找到“任务列表树”,打开“自然语言组”文件夹,并选中“文法列表资源右击鼠标进入选择”选择“导入任务至该分组”i.D.将“爱奇艺.ljobx固定格式”文件导入即可,如下图所示:E.文件导入完成后,会出现“爱奇艺”任务F.选中“爱奇艺”右击,进行“编辑任务”G.“编辑任务”详细设置1.选择“方式二”2.“保存文件格式”设置为“所有记录保存为一个txt文件”3.“保存位置”可以自定义4.“文件模板”选择“视频模板(优酷).txt固定格式”I.之后三个全部选中,选中“爱奇艺”右击,
4、点击“开始任务运行”注意:从第二次开始,每次“开始任务运行”之前都要“清空任务所有采集数据”和“清空该任务网址库”,之后再“开始任务运行”三、优酷资源抓取A.安装火车头软件(直接将火车头的软件包解压到电脑的任意盘)B.打开火车头所在的文件夹,找到下图所示的图标并双击打开第一次打开会提示你是否更新,选择不更新i.C.在软件左侧界面中找到“任务列表树”,打开“自然语言组”文件夹,并选中“文法列表资源右击鼠标进入选择”选择“导入任务至该分组”ii.D.将“优酷.ljobx固定格式”文件导入即可,如下图所示:E.文件导入完成后,会出现“爱奇艺”任务接下来的步骤与爱奇艺资源抓取过程相同。
此文档下载收益归作者所有