欢迎来到天天文库
浏览记录
ID:39512553
大小:7.54 MB
页数:92页
时间:2019-07-04
《学位论文学术不端行为检测系统介绍与》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、学位论文学术不端行为检测系统介绍与演示同方知网技术有限公司2021/7/21大纲引入学术不端检测的必要性系统简介检测原理及方法检测指标类型及实例介绍系统功能及实例分析下一步工作引入学术不端检测的必要性培养良好的科研诚信对于研究生的一生至关重要如果不能从研究生培养环节遏制学术不端行为,带有不端治学态度的研究生毕业后,不断涌入各级研究机构,不端行为就将形成“长江之水,滔滔不绝”,就不能从根本上扭转不端行为不断恶化的事态。系统简介(1)CNKI自适应多阶指纹(AMLFP)特征比对资源库检测文献文献比对检测结果系统简介(2)待检测测文档段落,句子,改写,组合,支持超长文章,学位论文,
2、图书专著。指纹XXX-YYY-CCC-DDDD-KKK-FFFFCNKI自适应多阶指纹(AMLFP)特征检测速度快,准确率,召回率较高,抗干扰性强检测系统框架文章特征库待检测论文重复内容比对文章比对库期刊会议学位论文专利报纸图书工具书注册文章抄袭伪造篡改专家复合审查事实数据库学者规范数据科研规范机构科研成果引文统计YesNo系统简介(3)系统主要功能:已发表论文检测论文检测问题库查询自建比对库管理其他功能系统简介(4)目的:辅助人的工作提供一台高性能“仪器”,生成一套检测指标,为审查人员判断学位论文的性质提供相关依据。原则:查全率优先检测原理及方法(1)采取的技术有:文本数据
3、库加工技术文本数据库技术知识挖掘技术中文自然语言处理技术……检测原理及方法(2)依据的资源有:文献数据库事实型数据库知识库知识元库……检测原理及方法(3)用户提供的资源:检测论文内容*论文作者*作者单位发表时间……只有论文内容是必需的。但我们建议,最好输入作者信息。检测原理及方法(4)检测论文内容检测文字复制情况的基本数据,是必须提供的资源发表时间发表时间是判断论文抄袭的基本数据之一,谁抄袭了谁的判断基础就是时间。若用户没有明确指明时间,则系统认为用户提交的论文的发表时间为当前时间。论文作者作者单位将自己过去发表的文献放入到学位论文中是一种合理的行为。提供作者信息,系统能够自
4、动按照本人文献和非本人文献分类,便于审查人员审查。将作者已发表文献列出来,为连环抄袭判断提供依据。避免“冤枉好人”A->B->A检测原理及方法(5)检测原理及方法(6)检测结果包括:重合文字来源文献信息比对信息检测指标诊断类型检测报告……检测原理及方法(7)重合文字来源文献信息详细列出重合文字来源文献,这些文献都是真实存在,而且应是公开发表或得到发表确认的比对信息检测论文和来源文献的详细比对信息,这主要是便于人的审查。检测指标总检测指标和子检测指标指标从多个角度对检测文献中的文字复制情况进行了描述。诊断类型系统根据指标参数以及其他元数据相关信息,自动给出对抄袭严重程度的一个判
5、断。供审查人员参考。检测报告详细列出了检测论文中的抄袭情况。用户3用户1Server1监测服务Server2监测服务Server3监测服务学位论文期刊学术文献用户2用户4用户5会议论文用户自有资源报纸文献Server1监测结果Server2监测结果Server3监测结果专利全文系统示意图检测指标总检测指标学位论文一般篇幅较长,检测系统会自动按章节切分(无章节信息则按字数切分)。总检测指标指对论文全貌的检测描述。子检测指标对于学位论文每一章节,检测系统对每一章节均生成一套指标系数。详细描述每一章节的检测情况。总检测指标总重合字数(CCA)总文字复制比(TTR)总文字数(TCA)
6、疑似章节数(QCA)总章节数(TCA)首部重合文字数(HCCA)尾部重合文字数(ECCA)段落最大重复字数(MAXA)段落最小重复字数(MINA)总重合字数学位论文一般篇幅大,少则3~5万字,多则十几万字,若以文字复制比来衡量一篇论文的文字重合情况,不太合适。因为对于一篇十几万字的博士论文来说,10%就已达到1万字,文字复制情况已经非常严重。对于博硕士论文检测,检测系统使用绝对字数即总重合字数作为检测结果的核心指标。总文字复制比、总文字数总文字复制比总文字复制比则是指学位论文中总的重合字数在总的论文字数中所占的比例。通过该指标,我们可以直观了解到重合字数在该检测学位论文中所占
7、的比例情况。总文字数指该检测论文所有包含的字数,文字复制比与总文字数的乘积即为重合字数。疑似章节数、总章节数疑似章节数是则检测论文疑似存在学术不端行为的章节的数量。总章节数则是指学位论文总的章节数(对于不按章节显示,而是按照固定长度切分的论文,每一切分段落为一章节)。首部重合文字数、尾部重合文字数首部重合文字数指学位论文前1万字中重合的文字数量。尾部重合文字数是指除去前1万字,剩下的部分中重合的文字数量。对于学位论文,一般开头部分均是综述性的报告介绍,其重要性远低于论文尾部。段落最大重复字数、段落最小重
此文档下载收益归作者所有