欢迎来到天天文库
浏览记录
ID:13785744
大小:48.00 KB
页数:4页
时间:2018-07-24
《获取网页中全部图片》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Web;usingSystem.Web.Mvc;usingSystem.Net;usingSystem.IO;usingSystem.Text;usingSystem.Text.RegularExpressions;namespaceSyccw.Controllers{publicclassGet_Url{//////获取网页中全部图片//////网页地址2、ram>///网页编码,为空自动判断///全部图片显示代码publicstringgetImages(stringurl,stringcharSet){strings=getHtml(url,charSet);returngetPictures(s,url);}//////获取网页中全部图片//////网址///全部图片代码publicstringgetIma3、ges(stringurl){returngetImages(url,"");}publicstringdoman(stringurl){Uriu=newUri(url);returnu.Host;}//////获取网页内容//////网站地址///目标网页的编码,如果传入的是null或者"",那就自动分析网页的编码///publicstringgetHtml(stringurl,stringch4、arSet){WebClientmyWebClient=newWebClient();//创建WebClient实例myWebClient//需要注意的://有的网页可能下不下来,有种种原因比如需要cookie,编码问题等等//这是就要具体问题具体分析比如在头部加入cookie//webclient.Headers.Add("Cookie",cookie);//这样可能需要一些重载方法。根据需要写就可以了//获取或设置用于对向Internet资源的请求进行身份验证的网络凭据。myWebClient.Credentials=CredentialCache.DefaultCrede5、ntials;//如果服务器要验证用户名,密码//NetworkCredentialmycred=newNetworkCredential(struser,strpassword);//myWebClient.Credentials=mycred;//从资源下载数据并返回字节数组。(加@是因为网址中间有"/"符号)byte[]myDataBuffer=myWebClient.DownloadData(url);stringstrWebData=Encoding.Default.GetString(myDataBuffer);//获取网页字符编码描述信息MatchcharSetM6、atch=Regex.Match(strWebData,"7、RegexOptions.Multiline);stringwebCharSet=charSetMatch.Groups[2].Value.Replace(""","");if(charSet==null8、9、charSet=="")charSet=webCharSet;if(charSet!=null&&charSet!=""&&Encoding.GetEncoding(charSet)!=Encoding.D10、efault)strWebData=Encoding.GetEncoding(charSet).GetString(myDataBuffer);returnstrWebData;}publicstringgetPictures(stringdata,stringurl){MatchCollectionps=Regex.Matches(data,@"]*?bsrc[str]*=[str]*[""']?[str]*(?[^s
2、ram>///网页编码,为空自动判断///全部图片显示代码publicstringgetImages(stringurl,stringcharSet){strings=getHtml(url,charSet);returngetPictures(s,url);}//////获取网页中全部图片//////网址///全部图片代码publicstringgetIma
3、ges(stringurl){returngetImages(url,"");}publicstringdoman(stringurl){Uriu=newUri(url);returnu.Host;}//////获取网页内容//////网站地址///目标网页的编码,如果传入的是null或者"",那就自动分析网页的编码///publicstringgetHtml(stringurl,stringch
4、arSet){WebClientmyWebClient=newWebClient();//创建WebClient实例myWebClient//需要注意的://有的网页可能下不下来,有种种原因比如需要cookie,编码问题等等//这是就要具体问题具体分析比如在头部加入cookie//webclient.Headers.Add("Cookie",cookie);//这样可能需要一些重载方法。根据需要写就可以了//获取或设置用于对向Internet资源的请求进行身份验证的网络凭据。myWebClient.Credentials=CredentialCache.DefaultCrede
5、ntials;//如果服务器要验证用户名,密码//NetworkCredentialmycred=newNetworkCredential(struser,strpassword);//myWebClient.Credentials=mycred;//从资源下载数据并返回字节数组。(加@是因为网址中间有"/"符号)byte[]myDataBuffer=myWebClient.DownloadData(url);stringstrWebData=Encoding.Default.GetString(myDataBuffer);//获取网页字符编码描述信息MatchcharSetM
6、atch=Regex.Match(strWebData,"
7、RegexOptions.Multiline);stringwebCharSet=charSetMatch.Groups[2].Value.Replace(""","");if(charSet==null
8、
9、charSet=="")charSet=webCharSet;if(charSet!=null&&charSet!=""&&Encoding.GetEncoding(charSet)!=Encoding.D
10、efault)strWebData=Encoding.GetEncoding(charSet).GetString(myDataBuffer);returnstrWebData;}publicstringgetPictures(stringdata,stringurl){MatchCollectionps=Regex.Matches(data,@"]*?bsrc[str]*=[str]*[""']?[str]*(?[^s
此文档下载收益归作者所有