加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

知网论文查重“去除引用文献”和“去除本人文献”百分比的理解

(2017-10-26 10:22:46)
分类: 工作札记
两年前我写了一篇关于中国知网论文查重中的“去除引用文献”和“去除本人文献”百分比的理解,之后一直还是困惑。期间有博友相约讨论,但是因为很久很久不上博客写文章,密码都记不全了,记得期间登陆过一次,今天好容易登陆博客还要验证码!好容易登陆成功,再来重新理解一下,希望有路过的同志们,一起讨论,所谓真理越辩越明http://www/uc/myshow/blog/misc/gif/E___6724EN00SIGG.gif

我今天根据中国知网提供的报告单,用计算器算了一下,弄懂了下面一些情况:http://s5/mw690/001iSjiPzy7fj1ZwrFq64&690

http://s16/mw690/001iSjiPzy7fj0Xip4zdf&690

首先看“总文字复制比”,根据上面的报告单,要查重的文章字数是11671,其中就有8715个字是重复的,8715÷11671=0.747,这个重复字数,不管是引用别人的,还是引用自己的。不管是注明出处比较规范引用的,还是没有注明出处随手摘抄来的,都算在重复字数之内。因此这篇文章总的重复字数占整篇文章的百分比就是74.7%。

再来看“去除本人已发表文献复制比”,根据上面的报告单,要查重的文章字数是11671,这篇文章出自已经上传到知网上的博士毕业论文,因此知网系统识别出来,这文章中大部分内容都是作者本人自己的文章。作者博士论文中的重复字数是8715,因此这篇文章中就有8715个字是重复的,知网系统把这8715个字去除出来,然后计算这个重复本人文献的字数占据整篇文章的百分比:8715÷11671=0.747,因此本人已经发表文献的重复字数占整篇文章11671的百分比就是74.7%,和“总文字复制比”是一样的。
那么根据这个思路来看“去除引用文献复制比”,意思就是全文中引用了别人的文献的字数占据总字数的百分比,这个引用是标明引用出处的,是属于比较规范的引用。在报告单上一般用绿色标识出来。如果这个复制比引用太高,比如说有的刊物要求是不能超过15%,有的是要求不能超过5%,总是就是不能过度引用,引用别人的材料太多,自己的东西就会相应减少,会影响到学术价值、学术规范等。比如上面这个报告单,去除引用文献复制比是3.1%,说明本文的文章内引用的字数是大约286个字,占本文总字数9236的百分比是3.1%,都是注明出处的。我没有把报告单中标上绿色的字数一起算过,但是粗粗看来,应该是这个结果。


我在看很多查重报告单的时候会发现一个问题:所有的文章查重的结果有一个共同点,就是“总文字复制比”一直是和“去除本人已经发表文献复制比”是一样的,而且在对比中还发现,有的作者是第一次发表文章,仍然有去除本人已发表文献复制比;或者说我们隐藏了作者的姓名上传查重,重复的字数也很少,根本也不是重复注意作者自己的文章,仍然把这些重复文字算在去除本人已发表文献复制比当中,这个现象说明什么问题呢?

说明知网就是把总文字的复制比等同于去除本人已发表文献复制比,查重系统有时候无法鉴别出是不是作者自己本人已经发表过的文字,但是因为这重复字数又包括没有注明引文出处的,所以都笼统算作是作者已经发表的文章之内了。其实从这个复制比中可以看出两个问题:一是作者有没有把自己的文章一稿多发;一是作者发表文章时不规范引用别人的文章(就是抄袭,不注明出处拿来就用的)。所以当我们选择稿件复制比的时候,要对比着看,一是个看标明出处的引用复制比是否太多存在过多引用的现象,一个是看去除本人已发表文献复制比,看是否有一稿多投或者抄袭别人的现象。所以看重复率的时候要以总文字复制比为主,去除引用复制比为辅。


http://s12/mw690/001iSjiPzy7fj7gH3mP9b&690
此外,之所以让大家对文章复制比比较迷糊的关键是知网查重系统的说明,语言表达方面很容易让人产生误解,尤其是对喜欢咬文嚼字的编辑和老师来说。比如,上面图片中说“去除本人已发表文献复制比”是“去除作者文人已发表文献后,计算出来的重合字数在总字数中所占的比例”,它要表达的意思是“作者本人已经发表文献与这篇文章重合字数在这篇文章总字数中所占的比例”,或者说是“作者本人已发表文献的字数与所查重的文章总字数的比率”,前面不需要“去除”两个字,用了“去除”仍然让人理解为:去除了作者已经发表文字之后,文章中还有重合的字数在总字数中所占的比例。

所以,我猜想,用了“去除”两个字,可能是制作类似程序、设置这些类似系统的专业人士特有的表达?因为他们一般不是文科生,可能要表达的意思是:先把这些重复的字数”去除“出来,然后拿这个”去除“的重复字数来和全文总字数放在一起计算它们的重合比率?http://www/uc/myshow/blog/misc/gif/E___6696EN00SIGG.gif

 
 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有