用字统计证明《红楼梦》后四十回与前八十回是同一作者创作
(2019-06-19 08:08:09)
标签:
文化交流红学散文 |
分类: 元红学散文 |
用字统计证明《红楼梦》后四十回与前八十回是同一作者创作
By金品之
(以下仅为纲要)
一
假设:
文学是语言艺术。作家拥有个人独特的语言风格和遣词造句习惯。在长篇巨作中,这种风格和习惯会大致保持一致,不因内容变化而呈现显著差异。表达情感的语词可能例外。《红楼梦》后四十回与前八十回是否同一作者创作,可据此证明之。
二
方法:
取书中用得最多的36个字词,考其在前80回和后40回出现的频次。然后计算比例。若前80回频次/全书频次≈0.67,后40回频次/全书频次≈0.33,后40回频次/前80回频次≈0.5,则证明《红楼梦》后40回与前80回为同一人创作。
三
样本:
取样字词排序,主要参考网络公开发布的《红楼梦用字表》(北美大牛,2013),但各字词使用频次均经我重新逐一核定。可能因为所用版本和统计工具不同,我的数据与用字表有别。36字词分三次统计,每组12个。(寓意12钗、副冊、又副冊。一笑!)36字词依次借用三十六个干支标记。
请注意:这绝对是一项大样本研究,该36字词在全书出现频次为265085次,全书总字数为732115个。265085/732115=0.36.就是说,《红楼梦》七十多万字,其中将近四成用的就是这36个字!36字的出频正好占全书字数的36/100,这也真是巧合!
四
数据
(一)红楼梦用得最多的12字
全120回
前80回
后40回
前/全
后/全
后/前
甲子=21216
14266
6950
0.67
0.33
0.49
乙丑=
0.65
0.35
0.51
丙寅=
0.67
0.33
0.50
丁卯=
0.72
0.29
0.40
戊辰=
0.65
0.35
0.53
己巳=
0.66
0.34
0.51
庚午=
0.65
0.35
0.53
辛未=
0.63
0.37
0.58
壬申=
0.65
0.35
0.54
癸酉=
0.70
0.30
0.43
甲戌=
0.70
0.44
乙亥=
0.71
0.29
0.41
一总
211458
0.67
0.33
0.49
211458/732115=0.29
(二)红楼梦用得次多的12字
前80回
后40回
前/全
后/全
后/前
丙子=
0.28
0.39
丁丑=
0.68
0.32
0.47
戊寅=
0.61
0.39
0.63
己卯=
0.67
0.33
0.50
庚辰=6089
4023
2066
0.66
0.34
0.51
辛巳=
0.66
0.34
0.52
壬午=
0.66
0.34
0.52
癸未=
0.65
0.35
0.54
甲申=
0.27
0.37
乙酉=
0.74
0.26
0.36
丙戌=
0.72
0.28
0.38
丁亥=
0.59
0.41
0.70
二总
71132
0.33
0.49
71132/732115=0.10
(三)红楼梦用得再次多的12字
前80回
后40回
前/全
后/全
后/前
戊子=
0.57
0.43
0.75
己丑=
0.60
0.40
0.68
庚寅=
0.31
0.44
辛卯=
0.62
0.38
0.61
壬辰=
0.66
0.34
0.50
癸巳=
0.57
0.43
0.75
甲午=
0.36
0.57
乙未=
0.62
0.38
0.60
丙申=
3381
586
0.85
0.15
0.17
丁酉=
0.65
0.35
0.55
戊戌=
0.69
0.31
0.44
己亥=
0.54
0.46
0.84
三总
52176
0.64
0.36
0.48
52176/732115=0.07
全总334766
0.66
0.34
0.49
五
结果:
假设被精准证实。(最多十二字均比0.67
0.33
0.49,次多为
0.67
0.33
0.49 ,再次多为0.64
0.36
0.48,三十六字总均比为0.66
0.34
0.49)
如假设本身无逻辑缺陷,则“红楼梦》后四十回与前八十回是同一作者创作”命题成立。
(附注:36字词中唯一偏移太大的用“丙申”标记的那个字是“笑”,它的偏移证实假设中“表达情感的语词可能例外”的猜想。详见前贴《对《红楼梦》书中所用“笑”和“笑道”的统计及寓意诠释》。另,反义词“哭”可援为旁证:“哭”在全书出頻601次,前部269,后部332,反超很多。)