欢迎来到天天文库
浏览记录
ID:53076834
大小:557.34 KB
页数:4页
时间:2020-04-16
《网络信息摘录与脱机Web应用程序的构建-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2014年第2期文章编号:1009—2552(2014)02—0163—04中图分类号:T~91文献标识码:A网络信息摘录与脱机Web应用程序的构建张宝明(上海理工大学管理学院,上海200093)摘要:在网络数据膨胀的今天,将网络中有用数据摘录下来,并组织成脱机Web应用程序形式,不但便于移动设备浏览,而且能有效减少移动流量消耗,节省费用,提高安全性。为此,讨论了HTMI_5应用程序缓存机制、数据挖掘规则定义与数据提取、数据清洗入库、脱机Web应用程序的实现。在数据挖掘的过程中,一些动态网页需要进行登录认证才能访问,登录认证的方式有多
2、种,如HT'FPS、H1丫rPDigest、HTTPBasic和网页表单认证等,为减少复杂性,文中采用了FireFox浏览器安全认证方式。在数据清洗入库和脱机Web应用程序生成的过程中,利用PHP脚本和Html5语言,实现了相关功能。实验表明,文中方法可行,效果较好。关键词:信息摘录;脱机Web应用程序;数据提取SummarizingcyberinformationandbuildingofiineWebapplicationsZHANGBao—ming(BusinessSchool,UniversityofShanghaiforSc
3、ienceandTechnology,Shanghai200093,China)Abstract:Intoday’Sexpandingnetworks,thatsummarizecyberinformationandbuildofflinewebapplicationsnotonlytofacilitatethemobiledevicestobrowse,butalsocaneffectivelyreducemobiletrafficconsumption,savecostandimprovesecurity.Therefore,th
4、ispaperdiscussesonsomeissues,includingthecachemechanismofHTML5application,datamininganddataextractionruledefinition,datacleaningstorage,ofiinewebapplicationimplementation.Inthedataminingprocess,somedynamicpagesneedtologincredentialstoaccess.Thereareavarietyofloginauthen
5、ticationmethods,suchasHTrPS,HTrPDigest,H1TI1PBasicauthenticationandwebforms,etc.Inordertoreducecomplexity,itusestheFireFoxbrowsersecurityauthentication.Intheprocessofdatacleaningstorageandofflinewebapplicationgeneration,itusesPHPscriptinglanguageandHtml5torealizerelated
6、functions.Theexperimentsshowthatthismethodisfeasibleandtheeffectisgood.Keywords:summaryofinformation;offlineWebapplications;dataextraction0引言还可免去登录认证动态网页的烦恼,安全快捷;同时,若能形成脱机Web应用程序形式,通过在无线随着移动网络的普及和带宽的增加,无线上网公用(或无线企业)网中一次联机访问,可长时间脱给移动族们的工作、生活带来了很大便利,但同时也机浏览(如在旅途中),从而减少流量耗
7、费,节省上带来一些烦恼。由于各种网络中的海量数据未能有网费用,成为时下移动族的一种现实需求。效加以组织,加之浏览格式设计并不完全适合移动为了实现此目的,首要的工作是要将网络中的设备,造成浏览不便,占线时间长,无线流量耗费大数据挖掘出来,在此基础上再对数据进行清洗、修正等问题,产生不小的费用压力。同时,在访问某些动态页面时,频繁的登录认证还会造成潜在的安全问收稿日期:2013—06—14题。因此,有必要将各种网络中的数据通过挖掘的作者简介:张宝明(1967一),男,副教授,研究方向为信息管理、电子商务。方式,自动组织成摘录形式,以方便移
8、动族们阅读,一l63—(2)创建分页抓取的线索为了对抓取的数据进行清洗,并整理入库,需要在ClueEditor工作台,创建一个相对线索(Re1.编写相关的脚本。利用PHP脚本进行处理的流程ative类型)或记号线索(Ma
此文档下载收益归作者所有