自适应话题跟踪技术研究

自适应话题跟踪技术研究

ID:33468092

大小:1.95 MB

页数:52页

时间:2019-02-26

自适应话题跟踪技术研究_第1页
自适应话题跟踪技术研究_第2页
自适应话题跟踪技术研究_第3页
自适应话题跟踪技术研究_第4页
自适应话题跟踪技术研究_第5页
资源描述:

《自适应话题跟踪技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、圈内图一}5分类I√I:TP391.1国陌:图}}分类lj:004.62硕士学位论文#饺f℃旧:10079崭级:公开自适应话题跟踪技术研究硕士研究生:导9ili:申请学位:学科:专业:所在学院:答辩日期:授予学位单位:武军娜戚银城教授工学硕士信息与通信工程信号与信息处理电气与电子工程学院2013年3月华北电力大学ClassifiedIndex:,

2、'P391.1U.D.C:004.62ThesisfortheMasterDegreeResearchonTechnologiesofAdaptiveTopicTrackingCandidate:Sup

3、ervisor:School:DateofDefence:Degree—Conferring-Institution:胁JunnaProf.QiYinchengSchoolofElectricalandElectronicEngineeringMarch,2013NorthChinaElectricPowerUniversity华北电力大学硕士学位论文原创性声明本人郑重声明:此处所提交的顾士学位论文《自适应话题跟踪技术研究》,是本人存导师指导下,在华北I-11/'j-:c:学攻读硕士学位期间独立进行研究工作所取得的成果。据本人所知,论文小除已注明

4、部分外彳i包含他人已发表或撰写过fl,9币,Jt:究成果。对本文的研究工作做“j重要贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签名:斌军唧堋:2..013年弓月/尹I华北电力大学硕士学位论文使用授权书《自适应话题跟踪技术研究》系本人存华北电力大学攻读硕士学位期问存导师指导下完成的硕士学位论文。本论文的研究成果归华:I匕电力大学所有,本论文的研究内容小得以其它单位的名义发表。本人完全了解华jk电力大学关于保存、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版本,同意学校将学位论文

5、的全部或部分内容编入有关数据库进行检索,允许论文被查阅和借阅。本人授权华北电力大学,可以采用影印、缩印或扫描等复制手段保存、可以公布论文的全部或部分内容。本学位论文属于(请在以上相应方框内打“、J”):保密口,存年解密后适用本授权书彳i保密/LJ势】:2.0J3年弓月J午uU期:孔吖3年3月,PU华北电/JJ、1学坝I’、≯侮论文摘要现代计算机Ij【)9络已经渗透到人类生活的方方面面。网络上每天充斥着海量的信息并且时时更新,如何筛选甄别网络信息成了一项口益严峻的研究任务。话题跟踪技术就是存此基础上发展起来的。该项研究主要针对新闻报道类信息,目的是

6、监控新闻报道信息流,持续收集指定话题的后续报道。而具各自学习能力的话题跟踪系统被称为自适应话题跟踪。本文主要进行了以下几方面的研究』:作:首先,针对话题跟踪任务中存在的训练语料稀疏和话题漂移问题,本文提出了基于静态模型和动态模型相结合的双态话题模型自适应技术。其中,动态模型结合滑动文本窗机制捕捉话题新内容并去除过时内容,及时反映话题侧重点的变化,同时扩充了话题模型的语料;静态模型起制衡作用,避免可能存在的错误判断。在与现有话题跟踪系统实验对比结果中,准确率提高2.73%,召回率提高1.98%,综合指标提高2.42%。双态话题模型可以显著提高自适应

7、话题跟踪系统的性能。其次,话题跟踪中的固定阈值有j

8、;u始值难以确定和调整幅度难以把握的缺点。针对这一问题,本文对现有的阈值算法进行了总结,并结合动态阈值模型,探讨了两种新的自适应阈值模型算法。实验结果中,准确率比改进之前提高了2.65%;召回率提高了12.20%;综合指标提高了7.41%;而阈值适应区间仅为O.05。即本文提出的改进算法在小需要大量实验测取经验值、实验坏点相对较少的优势下,可以达到较好的自适应跟踪性能。最后,针对话题模型中存在大量非重要特征噪声这一问题,将语义域话题模型首次应用到了自适应话题跟踪系统中。以新闻标题作为报道语义域的

9、凝聚核心,以句子为单位集聚报道主题,保留特征空问的主要内容。实验结果中,准确率提高0.96%,召回率提高4.40%,综合指标提高了2.64%,语义域话题模型存简化步骤的同时,达到了较高的系统性能。自适应话题跟踪技术是自然语言处理、数据挖掘、智能信息处理等各领域交叉学科的重点研究内容,又是实际生活中提供便捷信息获取方式的重要手段。因此,无论从技术还是应用上而言,自适应话题跟踪技术研究都具有广阔的前景。关键词:自适应话题跟踪;静态模型;动态模型;动态闽值;标题语义域AbstractNowadavs。theIntemethaspermeatedinto

10、allaspectsofourlwes.AndtheTopicTrack迦technologyisdevelopedtoscreenin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。