java上的jquery?解析html利器—jsoup-编程开发技术

java上的jquery?解析html利器—jsoup-编程开发技术

ID:30777052

大小:84.00 KB

页数:6页

时间:2019-01-03

java上的jquery?解析html利器—jsoup-编程开发技术_第1页
java上的jquery?解析html利器—jsoup-编程开发技术_第2页
java上的jquery?解析html利器—jsoup-编程开发技术_第3页
java上的jquery?解析html利器—jsoup-编程开发技术_第4页
java上的jquery?解析html利器—jsoup-编程开发技术_第5页
资源描述:

《java上的jquery?解析html利器—jsoup-编程开发技术》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、Java.h的jQucry?解析HTML利器一Jso叩-编程开发技术Java上的jQuery?解析HTML利器一Jsoup原文出处:吴纹羽也许大家冇过在java运行平台上解析html的经丿力,通常的方式是将HTML以XML的形式进行结点解析,调用走阳本身的xml解析类库。这样的方式很容易理解并且很方便,但习惯用jQuery的各位是否在感叹能否在java屮像jQuery一•样获取标签内容,实现D0M操作呢?终于,发现了一个htrnl解析利器,jsoup!初次用jsoup的时候是在业余时间做一款漫画下载器的时候发现的,做漫画下载器时,因无法得到网站的API接口,所以只能通过解析H

2、TML的方式获得网页内容与图片,在网络上找到jsoup以后发现习惯于jquery方式编程的我很快就可以适应jsoup的选择器,得到内容的方式也很容易,下面我们就开始学习神奇的jsoupo1.下载jsoup大家可以去jsoup的官网卜•载jsoup,或者点击jsoup-1.7.3.jar(官方下载地址)jsoupNewsBugsDiscussionDownloadAPIReferenceCookbookTryjsoupisouD»DownloadjsoupDownloadjsoup■jsoupisavailableasadownloadable・jarjavalibrary.T

3、hecurrentreleaseversionis1.7.3•jsoup-1.7.3.jarcorelibrary•jsoup-i.7.3-sources.jaroptionalsourcesjar•jsoup・:i・7・3・javadoc・ja「optionaljavadocjarWhafsnewSeethe1.7.3releaseannouncementforthelatestchanges,orthechangelogforthefullhistory.MavenIfyouuseMaventomanagethedependenciesinyourJayaproject(

4、andyoushould!),youdonotneedtodownload;justplacethefollowingintoyourPOM'ssectiorrorg.jsoupjsoup1.7.3Dependenciesjsoupisentirelyselfcontainedandhasn

5、odependencies.jsouprunsonJava1.5andup.ScalaAndroid,OSGi,andGoogleAppEngine_2.jsoup初体验第一步??获取html文档对彖。Document对彖:用于接收html的文档内容Jsoup.connect(Stringurl).get():用于指定网址,返回值为Document对象ps:如果需要解析访问较慢的网站的话需要加上timeout方法,以放抛出RuntimcExccption异常。〃文档对彖,用来接收html页而Documentdocument=null;try{〃获取指定网址的页而内容docum

6、ent=Jsoup.cormect(〃http://www.baidu.com/").timeout(50000).get();}catch(TOExceptione){c.printStackTraccO;}另外我们除了通过网址的到HTML文档对象外还可以通过读取HTML文件來获取HTML文档,方法如下://获得文件对象Fileinput二newFile(〃/tmp/input.html〃);//获得文档对象Documentdoc=Jsoup・parse(input,"UTF—8","http://example.com/");上面这段代码很好理解,parse是Jsoup类

7、的静态方法,用于加载和解析HTML文档,其屮的三个参数分别为:参数1:要获取的文件对象参数2:HTML文档的文字编码例如UTF-8,ISO8859-1,GBK等等参数3:用丁•相对路径的前缀第二步??通过选择器得到想要的Dom结点jsoup提供了丰富的选择器,选择器的方便程度媲美jQuery,其屮的筛选选择器,父选择器等更是jQuery±本身就拥有的,具体该怎么用这个选择器呢?相信习惯jQuery的童鞋很快就会适应jsoup选择器的。首先我们需要认识一卜Elements对象,Elements类实现了ja

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。