资源描述:
《2016山东统计科研重点课题申报书范本》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、编号:山东省统计科研重点课题申报书课题名称:基于非结构化数据的专家综合评价技术研究与应用课题负责人:联系电话:负责人所在单位:山东省统计局制表2016年4月17日填课题名称基于非结构化数据的专家综合评价技术研究与应用课题负责人负责人所在单位山东职业学院课题组成员研究起止日期2016年6月至2017年6月一、申请理由(研究目的、意义及研究成果拟达到的目标)1.研究目的随着人类社会由信息社会迈向知识社会,专家资源己成为是各类组织中最有价值的核心资源,无论是在政府部门还是企业工厂等社会生产部门中都需要那些拥有丰富专业知识和技能的领域专家组织团
2、队来指导研发、攻关技术难关,以此提高工作或生产效率。例如在政府的科技部门中,为了使科技项目评估、科技成果评奖等工作顺利展开,政府部门一般都建立有一定数量的专家信息库,在课题评审、成果鉴定时,就从专家信息库中挑选与项目研究方向相关的专家组成评审小组。但要在海量的网络信息里找到合适的专家并不是一件容易的事,而人工蹄选获取方式是非常耗力耗时的。由此在组织内部通过输入关键词如何能够方便简单地查找该查询领域合适的权威专家信息成为一个重要的研究课题。2.研究意义在传统的Web搜索引擎中,例如百度、Google、Yahoo等较有代表性的搜索引擎,已经
3、成为人们查找获取网络信息的主要途径,依靠索引和关键字匹配技术找到各方面的相关网页并按相关性排序返回结果,极大提高信息查找效率,很大程度上改变了人们的生活工作方式。但如果需要通过传统搜索引擎获取相关专家,还必须借助人工方式逐个查看召回的文档信息,从中判断与查询相关的专家信息。另一方面专家的研究、内容和领域也是不断变化的,主要特点是以非结构化信息为主,表现形式为科研论文、项目文档、成果鉴定文件等。这些因素使得专家检索不能通过简单的关键字匹配就满足要求,而是要对专家的研究论文等非结构化数据的挖掘与分析,勾画出其涉及的研究领域,并通过智能综合评
4、价系统,定量评定专家相关领域的研究水平,准确描述专家,为企业、政府机构等组织提供准确查找专家服务。研究专家检索方法和技术对专家进行评价,针对特定机构构建专家检索系统对政府机构、企业等组织有重要意义,专家检索可以根据用户需求找到具有特定经验和技能的人,是企业非常有价值的辅助管理工具;并且促进组织和组织之间的信息和知识得以共享,对实现各组织隐性知识的转移和共享、增加组织内部人员交流、加强组织内外部人员协作、为项目或团队挑选合适人选等具有积极的作用。总而言之,专家检索有效地管理企业员工的知识和技能,对提升生产效率、创新能力和增强竞争力具有重要
5、的支撑意义。3.研究现状近年来,为了动态挖掘组织内部相关资源评价专家专长,国内外展开了一系列相关研究,TREC企业检索任务中的专家检索子任务在一定程度上代表了当前专家检索研究进展。作为WebTrack的后继项目,TREC于2005年起增加了企业检索(EnterpriseSearch)任务,并设立企业专家检索子任务,从2005年到2008年共举行了三届,该任务利用企业内部的网站网页、共享文档、电子邮件、数据文件以及日志等作为企业数据集,对于给定的查询条件,参与者构建专家识别和专家排序检索模型,并将得到的相关专家列表等结果返回给TREC组办
6、者进行测评。它主要是提供一个公共评测平台,为研究员根据组织检索人物,对专家检索方法和技术进行经验性评价,极大地推动了专家检索技术的发展。目前针对专家检索主要有以下几种方法:基于文档的专家检索方法、基于候选专家的专家检索方法、基于话题模型的专家检索方法和基于链接分析的专家检索方法。Balog等人提出了两种基于语言模型的专家检索策略:一种是基于专家的建模策略;另一种是基于文档的建模策略。(1)文档语言模型首先对每个候选专家,在企业知识库中找出与其相关的所有文档,然后在候选专家和与其相关文档之间建立一定联系,用来表示候选专家与文档之间关系的相
7、关性程度。给定査询条件,使用文本信息检索模型对文档进行评估,结果得到每个文档都有一个得分,用来表示文档与查询之间的相关性程度。最后对于每个候选专家,使用某种形式将各个相关文档的得分结合起来,从而得到每个候选专家的最终得分。(2)专家语言模型首先从企业知识库中识别每位候选专家并提取出相关信息,然后利用这些信息构建一个描述候选专家所拥有的知识和技能的知识说明文档,而这个文档就相当于候选专家的“简历”。当系统为所有候选专家都构建简历完成之后,候选专家与用户所提交的查询的相关程度就取决于这个“简历”和该查询的相关程度。最终,系统按相关程度高低将
8、专家列表返回给用户。为了从更深层次的隐含语义上抽取专家的研究领域,也有学者使用话题模型对专家进行建模。王美姣在文献中针对基于文档的方法忽略了用户输入查询与专家在隐含语义上的联系,提出了话题模型和文档相结合的