欢迎来到天天文库
浏览记录
ID:10259952
大小:522.50 KB
页数:5页
时间:2018-06-14
《批量下载维普的方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、批量下载维普的方法读书园地Soler声明:以下的方法可能并不适用于所有的维普,如果不能下载,不要骂人!1.首先你需要安装这个工具URL捕获工具urlsnooper作用:捕获要下载文件的实际地址下载地址:http://www.leapedu.com/download/tool/urlsnooper.zip然后运行,点击sniffernetwork,如图:2.登录维普,输入你的检索关键词比如说“美女”,然后随便下载一篇,如图3.看看Urlsnooper都抓下什么内容了,看看,找到这个没有:http://202.107.20
2、4.73/cstj/sear.dll?downcurpaper?pszno=13261&flag=0&type=2&dzsj=1&csid={4a465fb4-1ae6-483a-9141-57b261e3a456}这个就是该篇的下载地址,不过还不是实际的地址,维普稍微做了一下处理把这个地址拷贝到浏览器,看看怎么样:获得地址如下:succhttp://219.153.13.213/DownPaper.dll?DownCurPaper&CD=2007JY01&Info=GIHKGDHDACAIHKHKHHHFBKHOAE
3、BPAJAAACAGADGK&FILE=000/01S/23527010.pdf&FileName=历史上真有美女貂蝉吗.pdf是不是得到上面这个地址,注意http前面多出一个succ,由于增加了这个,就不能下载,所以我们只要把这个succ去掉,然后,就可以下载了,试试是不是?http://219.153.13.213/DownPaper.dll?DownCurPaper&CD=2007JY01&Info=GIHKGDHDACAIHKHKHHHFBKHOAEBPAJAAACAGADGK&FILE=000/01S/235
4、27010.pdf&FileName=历史上真有美女貂蝉吗.pdf注意:以你实际捕获的地址为准,如果直接用我这个地址,是不行的,因为我发现csid={4a465fb4-1ae6-483a-9141-57b261e3a456}这个参数,每次登录都不一样,而且有时间限制。4.如何实现批量下载呢?(有点麻烦)看看第3步,注意到这个没有pszno=13261,这个是文章的序号,你的任务就是找到你要下载文章的序号,然后,通过构造这个序号,我们就可以实现批量下载了。如果你找的文章序号是连续的,那就好办了。一般同一期杂志期刊的文章号
5、是连续的。下面的方法是把该篇文章后面的9篇文章一起下载下来:(1)利用迅雷生成批量下载任务(2)不过你会发现,被下载下来的都是sear.dll,其实这是个文本文件,你用记事本打开看看,是不是就是我们刚才看到的地址。每一个文件就是一篇文章的下载地址:(3)我们把这些dll文件合并在一起,就可以得到批量下载列表:你还需要一个文件合并工具:文本文件合并工具FileJoin作用:合并文本文件下载地址:http://p2s.newhua.com/down/FileJoin.exe合并到一个文件里面比如:F:DOWN.TXT,如
6、小这是,合并后的情况,如下,不过这个还不能直接导入下载,因为里面含有succ而且是连在一起的,没有分行,下载软件不能识别,所以还要稍微处理一下。(4)生成最终下载列表:把合并的文件(F:DOWN.txt)用WORD打开,用换行符替换掉succ,如下:注意用“人工换行符”,这里刚好巧妙的利用了这个succ,哈哈处理完毕,保存。现在这个down.Txt就是批量下载列表了,可以直接导入软件下载,结果如下 成功!注意:1.生成下载列表以后,最好马上下载,因为下次再打开时,这个csid={4a465fb4-1ae6-483a-
7、9141-57b261e3a456}参数可能就失效了2.关于pszno=13261文章序号的问题,我们常常要找的文章它的序号是不联系的。如果是这样的话,你要自己去找,对于有点维普入口我们可以通过urlsnooper直接获得文章的序号。对于有的入口就不行了
此文档下载收益归作者所有