面向军事特种医学深网信息的自动获取技术研究.pdf

面向军事特种医学深网信息的自动获取技术研究.pdf

ID:55576374

大小:183.82 KB

页数:2页

时间:2020-05-19

面向军事特种医学深网信息的自动获取技术研究.pdf_第1页
面向军事特种医学深网信息的自动获取技术研究.pdf_第2页
资源描述:

《面向军事特种医学深网信息的自动获取技术研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、·264·海军医学杂志2015年5月第36卷第3期JournalofNavyMedicine,Vo1.36,No.3,May2015[10]黄明,丁平英.护理从业人员职业生涯管理初探[J].现代护[14]张岚,陈冬梅.军队医院非现役护理文职人员执业感受的质性理,2005,11(14):1105—1106.研究[J].现代临床护理,2011,11(1):1-3.[11]李秀玲.论文职人员的身份认同[J].唐山师范学院学报,[15]张岚,宋婷婷.军队医院文职人员管理现状的调查[J].解放军2013,35(6):89-92

2、.护理杂志,2012,29(4B):9—12.[12]刘燕玲,陈海花,朱玲玲.军队医院非现役文职护士特质应对方(收稿日期:2014—12—27)式的研究[J].护理管理杂志,2010,10(9):622-623.(本文编辑:王映红)[13]李艳平,白菁.疗养院非现役文职护士工作压力与职业规划倾向调查[J].中国疗养医学,2010,19(9):853-855..工作研究.面向军事特种医学深网信息的自动获取技术研究杨柳,仇顺海[关键词]网络信息资源;深网;信息检索;对象抽取[中图分类号]TP311.13[文献标识码]A[

3、DOI]10.3969/j.issn.1009—0754.2015.03.029互联网上存在的国外军事特种医学研究信息具有一定储,并且无法直接获取。为此,笔者研究了面向深网的信息的保密性和时效性,采用简单搜索方式难以查取。因信息大提取技术,研究并实现了一种面向军事特种医院资源的基于多在深网中存在,采用人工跟踪和捕获的方式耗费时间多,半监督顺序回归模型的快速爬虫算法J。数据初加工的人力消耗大,不利于数据的长期积累。此算法主要包括以下3个步骤:首先,根据军事特种医1研究背景院网站资源的特点,利用半监督顺序回归的方法构造深

4、网页由于科研任务的需要,笔者在开展网上特种医学资源研面分类器,定义所需的主题相关的网页分为Ⅳ个不同的层究时接触到大量处于网站深层结构中的拒绝链接或未被链次。此时层次的数量级根据所给定网站资源特点设定。一接的“孤岛网页”、动态网页等深网数据。这些网页因隐藏的般情况下,Ⅳ≤4。其次,构造深网链接信息抽取器,抽取对应专业数据数量多,且发展速度快,成为重要的网络数据来源。Ⅳ层次的有效链接。在提取这些链接信息时,采用多线程的据统计,大约一半的军事医学研究类数据存在于主体明确的方法完成。最后,把深网页面分类器的分类作为指导,形成

5、网络数据库中,其中,部分隐蔽数据难以通过普通搜索引擎特征库,利用让爬虫自动提取满足要求的链接特征,快速实但可以通过相关技术手段追踪获取。时地找到各层有效链接。由于深网数据数量多、链接层次深,利用传统人工追踪对于爬行过程而言,笔者具体采用如下方法:在开始爬和获取方式进度慢,人力和物力消耗大,不利于深网信息的行前,把预先定义的符合特种医院资源信息的种子放入最低长期提取。针对此特点,笔者提出利用已较为成熟的计算机层的链接队列中,链接信息提取器从深网页面中抽取满足特技术和信息技术,研究适用于深网的信息抽取和索引方法,点规则的

6、链接信息,包括链接的网址、页面标题,链接的锚属以形成对信息资源自动捕获的数据建构模式。性等信息,并同时交付链接特征学习器。在链接特征学习器2面向深网资源的信息抽取与分类技术研究中,笔者将采用深度机器学习方法,将这些特征进行归类、分笔者以实现深网信息自动化获取为研究目标,从面向深析。然后,按照上述方法,将所有Ⅳ层队列中的链接进行爬网资源的搜索提取方法、面向实体层Web的信息索引和分行。对于同一层次的链接,根据预先定义的规则让距离网站类技术、面向用户的信息检索平台建设3个技术层面展开研主页近的链接先爬行。这样,既可以爬行

7、到最佳的链接,又究,有计划地将大量无序的特色网络资源实现自有化并得以保证让所有的链接都被爬行到。系统运行结果表明笔者提快捷利用。出的爬行策略能够提取深网中有效链接的基本特征,并过滤2.1基于半监督顺序回归模型的爬虫算法在资源搜索方掉无关链接,提高了爬虫的速度和准确度。面,将搜索目标设定为通常无法订购但军事特种医院特点鲜2.2面向实体层Web的信息索引技术采用高效的爬明的特色资源。通常,这些网络资源都是以深网的方式存虫技术从Deepweb上抽取出的军事特种医院特点鲜明的特色资源之后,将其存储在本地数据库中。对于索引而言

8、,由[作者单位]200433上海,海军医学研究所医学科技信息中心于军事特种医院信息的特色,其索引对象可表示为Web实海军医学杂志2015年5月第36卷第3期JournalofNavyMedicine,Vo1.36。No.3,May2015·265·体(WebEntity)。Web实体通常具有各种属性,并由属性进行描述。如海军信息、潜水艇实体,具

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。