正文描述:《net抓取和分析网页的类》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、主要功能有:1、提取网页的纯文本,去所有html标签和javascript代码2、提取网页的链接,包括href和frame及iframe3、提取网页的title等(其它的标签可依此类推,正则是一样的)#region私有成员privateUrim_uri;//网址privateListm_links;privatestringm_title;privatestringmhtml;privatestringm_outstr;privateboolm_good;privateintinpages
2、ize;privatestaticDictionary()4、可以实现简单的表单提交及cookie保存第一部分usingSystem;usingSystem.Data;usingSystentConfiguration;usingSystem・Net;usingSystem.10;usingSystem.Text;usingSystem.Collections.Generic;usingSystentText.Re
3、gularExpressions;usingSystem・Threading;usingSystem.Web;///
显示全部收起
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。