学术上的不合理行为在论文发表中普遍存在,因为具有较强的隐蔽性,所以要预防和揭发这些学术上的不合理论文,有一定的难度〔1〕。学术上的舞弊是编辑审查原稿过程中的重要内容[2]。
在实际工作中,学术不好的文献检查系统功能强大,通过对原稿进行论文的调查,提供相关的参考文献进行比较分析,帮助编辑对原稿做出正确的判断,极大地进行编辑工作的效率,有效打击了学术的舞弊行为。然而,学术上的非端文献论文的验证/复查系统也有几个孔,测量结果只能作为参考,我们需要客观且合理地处理检查结果。通过学术上的非端文献检查系统的论文调查的结果,显示了与其他已经发表的论文重复部分少的原稿,即低重复率的原稿。一部分低重复率原稿可能有学术性的不正当行为。
正文对编辑在重检查过程中遇到的几个重复率较低,但有剽窃嫌疑的原稿进行原因分析,提出建议让编辑能够更好地检查。1作者投稿了原稿的检索结果后,关于杂志刊登范围内的原稿,编辑首先测量文字的重复率。测定结果分为以下两种。
的其中一个是重复率高的原稿。一般认为文字的重复率在30%以上的原稿有剽窃的嫌疑。通常直接取消原稿。但是,有些原稿还是要编辑根据具体情况做出客观合理的判断。
篇原稿来自研究生论文(未发表)中的一部分,以及作者毕业后关于同一课题的一系列研究的后续论文等,可以重新调查调查。此外,医学论文中相关的诊断标准、治疗效果标准、方法研究、疾病概念和药物成分、表现过程难免有重复,一般会不认为是剽窃。还有一个是重复率低的原稿。
这样的原稿通常有两种情况。一种是原稿具有革新性,观点正确,语言表达规范,具有理论价值和实用意义的好文章。两个原稿的文字重复率虽然低,但是有学术性的不合理。2原稿重复率低的原因分析2.1单一的检查系统有漏洞,认为有研究人员〔4〕学术缺陷检测系统有缺陷。这个主要是电脑开发软件制作的。一些反相抄袭的论文容易被系统误判,并获得较低的重复率。
中国知网(CNKI)、万方数据是国内最具影响力的两大论文数据库,分别收录了大量文献。由于独占授权的影响,数据源和著作权保护的竞争很激烈,所以两者的收录范围可能不一样。
大部分的论文都收录在CNKI和万方,但也有只收录了CNKI,没有收录在万方的论文。还有一篇论文收录在CNKI和万方。因此,同一原稿在同一时间、同一地点用AMLC和万方论文类似性检查系统测定时,其测定结果不同。
例如“血清游离核小体”…研究”一文中,AMLC检查后的检查重量率为6.1%,万方检查结果为66.7%。其他的书是《FOCUS-PPDCA程序》。的应用”中AMLC检查的重复率为40.2%,万方为5.9%。另外,不同文本格式的原稿搜索结果差异很大,无法解决公式、图表、外文重复率的问题。
2.新发表论文的上传数据库有时间差。新出版的论文被收录在数据库里。如果新发表的原稿和还没有收录在数据库里的论文内容相似的话,在检查文献的时候就很难发现问题,原稿中的复印部分有可能没有被检测出来。由于各种出版物之间信息的共享很困难,一部分作者都挖了个洞。就像
位作者见过一张原稿“二次元斑点”一样……的变更”是2014年1月2日第一次调查的结果,重复率为20.1%,2014年10月27日再次检查为34.0%。2.3作者对原稿有“修饰”的意识。由于作者有意做,有些原稿的内容确实存在学术上的问题。但是,文献检查系统难以检测重复部分,编辑在初审过程中容易被这种原稿欺骗。
)全文相同。抄袭者掌握了检查系统验证的原理,对复印的论文在文字方面进行了一定的处理。
通过对复印部分的文字进行“加工”,删除、分割、结合段落,改变句子和表达,将其他人的论文进行“改装”,做成自己的“论文”,顺利地错过了检查系统的检查。收到过原稿AMLC的调查结果为4.1%,万方为0,编辑发现与论文《后牙病理性磨损树脂修复的临床效果研究》相同。这两篇文章在摘要、引用、各级标题和图标方面基本相同。像
那样,“后牙病理性磨损树脂修复的临床效果研究”是引言部分的一句话,“牙齿磨损是一般的非蛀牙性损害,是影响口腔健康的另一个重要问题。成年人的牙齿磨损发生率接近100.0%,树脂修复…对此,他改为“作为一般的虫害,牙齿的磨损是损害口腔健康的重要因素,在大人中常见,发生率几乎达到100%”。
全文的其他部分几乎都是意思式的抄袭。2)核心内容相似。盗用别人的观点,考虑别人的设计发表论文的事也不稀奇。
位作者从与同事的友情中,修改了一些采用的原稿并投稿。这样的原稿采用了作者自己的文字表现,数据也有差异,但是全文的宗旨、核心内容和观点没有变化。第一次看原稿的时候,题材和内容和本杂志发表的另一个原稿很相似。只有例子的数量不同。经
确认,这两个原稿的作者属于同一部门的同一科。3)适用部分结果。因为
检测系统对一些图表几乎无法检测出,所以有些作者将已经发表的论文的图表重新包装后发送给其他杂志社。如果用文字叙述图表,或者将文字叙述转换成图表,则很难检测到该副本。作者会在多个杂志上投稿同样的原稿,或者在几本杂志上投稿内容相似的原稿。并且,除了第一作者以外,也有修改同一原稿(未发表)的内容投稿的情况。像
本那样,负责编辑检查了两次一张原稿后,原稿中的第二作者已经在几个月前以第一作者的名义在其他杂志上发表了论文。其中有2/3的数据和照片。经调查,这篇文章的第一和第二作者是夫妇。
2.4网络时代的伪造手法多样化的2005年,美国麻省理工大学的研究人员发现了SCIgen这个“神器”软件,并根据文字串生成了假文章。为了证明假论文在会议上容易被接受,其目的是不想让混乱的学术论文市场混乱。作者有
多个学术缺陷,通过几台计算机合成的假论文不断出现。随着网络科技的快速发展和伪造工具的频繁出现,原稿的多投和抄袭行为更容易被隐蔽。3对应策略3.1.使用多个数据库测量文字的重复率,目前国内单一数据库的定期刊物收录不完整,覆盖率不高,所以要100%检测原稿的重复部分可能很难。
个原稿的多个检索结果有助于编辑对原稿进行合理的判断。现在越来越多的数字出版社开发了新的数字资源平台,为编辑的学习提供资源空间