加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

《儿子韩寒》作者不是韩仁均的证据,以复旦大学古籍所苏杰博士的思路证明

(2012-03-26 21:48:02)
标签:

韩仁均

中苏

儿子韩寒

三重门

苏杰

《儿子韩寒》作者不是韩仁均的证据,以复旦大学古籍所苏杰博士的思路证明

              ----- 中国商军  2012-03-06 18:58 

   今天,看到复旦大学砖头苏杰博士写的《(三重门)作者身份的语言学分析》一文,保韩人士一片尖叫,最有典型的是鸡蛋大学的严锋叫兽:“哇,真正的校勘学专家,复旦古籍所得苏杰老师出手了。这一篇可以完爆所有质疑派的狗屁“文本分析”。”更有叫嚣者云:“真是个脑残,不懂就好好学学,或者请教一下你们的教主他的文本分析是啥玩意儿,可以让方舟子PK苏教授嘛。他还敢像把生物化学说成生物医学那样糊弄人?毕竟跨学科太远了。哦,万能的教主呀,阿门”......

   对此、偶只感到悲怆。虽然偶也是跨学科跨专业,偶专业一直是经济或管理,但区别是受过世界著名大学研究方法的规范训练。这不妨碍偶跨专业研究,因为科学的研究方法都是同样的定性或定量分析,只是分析内容不同,瓶子都一样,里面装的可以千变万化。

当然,苏博士作文的前半部很好,至少不用偶来普及语言分析对作者身份鉴别的常识了。苏博士搬了一个老外,以为可以唬人。偶也不知道他是否真读过这个老外的论文,还是选择性失明?明明老外在论文强调了要注意“共享”(注:只分析文本)文字比对的数量及比例,可是苏博士仅仅用5个词语就盲目轻率下结论。偶也不知道这个博士的论文是怎么做?如果也是这么草率下结论,那么他论文不用看,一定是个水货。

   经〈中国学术期刊网络出版总库〉查询,发现苏博士的论文有13篇,原来是古籍研究的啊?难怪了,按天朝官方的要求,搞古籍的人不要求英语,所以前面的那个老外的论文的内容,估计苏博士选择性失明了。

  

   苏博士的方法原理是很不错的,毕竟这些在西方已经有很多年的研究。虽然国内也正在发展,尤其是语言学的定量化研究,但是还是有很多成果,比如对〈红楼梦〉的作者鉴别,比如中国科学院声学所、武汉大学信息管理学院的研究就颇有成效。偶今天不作“文献回顾”了,有兴趣的人士,都自己去找文献看吧。

   这里,还是非常感谢苏博士,因为他交代了语言学对作者身份鉴别的科学性,保韩人士至少目前是十分相信这一技术,否则就是偶费劲口舌,也是对牛弹琴,因为他们习惯双重标准、习惯选择性失明。

    好吧,首先是肯定这一技术。

    其次呢,苏博士的分析过程也是不错的。

    但是苏博士在分析过程中犯忌了。对一个几万几十万字的作品,用词语成千上万的,仅仅使用5个词语就“权威”地下结论,这不免太片面!Malcolm Coulthard(2004)特别强调,分析文本词语选择时,要注意词语的数量、比例及长度(注:英语单词长度不同,也就是单词中字母的数量,但汉语则少有这方面的问题),请苏博士再好好读一读经典著作吧!尤其是Malcolm Coulthard编写的〈Theory and practice of forensic stylistics〉。另外,厦门大学中文系〈现代汉语常用词表〉课题组(2008)公布的研究说:“现当代社会生活中比较稳定的、使用频率较高的汉语普通话常用词语 56 008个”,可是我们鸡蛋大学的苏杰博士(2012)却说“我们发现,(三重门)和韩仁均作品在常用词语的使用频率有着非常明显的差异”,在5万多的常用词语中苏博士却只使用了5个词语:没想到、不幸、谁知、光、这人。这样的分析结论离谱就可想而知,偶也不在此罗嗦什么论证,只要正常人就明白,韩粉如有不明白,请主动与苏博士联系补课吧。

    到此,也有人脑子比较轴的问,“我就是相信苏博士的分析”。那好吧,偶就再陪你玩一会儿。

下面作一个假设:

   假设:苏杰博士在《(三重门)作者身份的语言学分析》是十分正确的,也是行之有效的。

既然这个假设成立,那么理论上应该是可以分析推广的,而不是只限于苏杰博士的case.偶这么一说,可以马上有人跳出来说:任何理论都是有适用范围的,不可能无限扩大。也不可能适用所有作品所有作者的语言鉴别研究。哈哈,是害怕偶构陷吗?

接下来,偶还是用苏杰博士方法分析他的文中举例的CASE,即《三重门》、《儿子韩寒》、还有韩仁均的故事会类型作品。偶所用的资料是包括苏博士提供的

1、《三重门》(去掉一些乱码后,有效文字153562)、

2、《儿子韩寒》(有效文字46336),

3、由于网上的韩1的故事会作品都影象版,无法电脑处理数据,而偶找到韩1文字版的作品仅有《捉鸟记》、《黄主任的担心》、《暗号照旧》。(三作品总有效文字是:5862)

 

这里要强调一下论证前提:

1、《三重门》的作者有争论。

2、韩仁均故事会的作品作者绝对是韩仁均的,我想这个无论倒韩、还是保韩的都应该承认,否则你不要往下面看了,滚吧!

3、根据苏博士的论证过程可知:由于“没想到”、“谁知”这两词三重门与韩1作品均有,认为显示不同的词语偏好,但苏博士没说什么偏好(注:偶认为他不懂怎么分析了);然后认为“光”、“不幸”、“这人”三词,《三重门》比较滥用,而韩仁均的作品中使用的几乎为0。

据此,苏博士的下结论的前提是:韩父不使用的,而《三重门》用的,所以两作品不是同一作者。

4、《儿子韩寒》这个作品,保韩在全部都相信是署名的作者韩仁均,而倒韩的目前也是大部分人认为是韩仁均写的。

因为有一部分不信《儿子韩寒》的署名作者,那么这部分人(尤其是本人)的直觉是不是有问题呢?请看偶的论证证据:

 

一、《儿子韩寒》的作者到底是谁?

    偶也从汉语常用词语中先找了如下7个词(比苏博士的3个多了近一倍啊,哈哈)对以上作品进行词频统计:一时间、一愣、还以为、只见、生怕、尴尬地、不再。

结果如下:

 

         三重门   儿子韩寒     韩仁均故事会

一时间、 2                       1

一愣、                         1

还以为、 2                       1

只见、                         4

生怕、                         1

尴尬地                         5

不再     11                      2

 

诸位看清楚啦:这几个词的使用特点相当明显地说明了,三重门的作者与署名韩仁均的故事会作品是同一人,而与《儿子韩寒》的作者根本就不是一个人。

别太奇怪啊!这就是苏博士的理论证明的,韩粉们,你们去鸡蛋大学找苏杰博士吧,抽耳光是起码的吧?哈哈。

   当然,在此,偶还是要给韩粉一点信心,偶上述的论证是不严密的,论证的可信度也就是笑话了。正常的作品分析,不能只使用“不用词”(这是苏杰博士使用的方法),而是还要包括低频词、高频词,同时考虑词语的在作品中总的使用比例,(苏杰博士,好好学学吧。)

 

  下面是另外两个词语的总频率(作品的次数/作品总字数)

                 三重门              儿子韩寒        韩仁均故事会

也不              0.000547           0.000842          0.000512

不知              0.000332           0.000194           0.000341

 

大家看仔细啊,《三重门》与韩仁均故事会作品的频率几乎相等啊!而与《儿子韩寒》的使用频率上相差很大,

 

    韩粉们,现在相信了吧?哈哈哈哈哈。

    不过,不要灰心,偶这里还是要给你们一点信心的,偶上述的两种方法的结论还是不严密的,因为没有考虑作品中总使用词语及这些词语的使用的信度与效度。

也就是说,据此判断《儿子韩寒》的真正作者是片面的?

 

    但是,(中国人一说但是,结果就完了,尤其是领导评论下属工作时,偶经常用的哦)

但是《儿子韩寒》的作者确实是有疑问。也就是可能存在其它人参与代笔或润色的可能。这个偶会在将来某个时间给出具体严密的论证。

 

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有