(三)正视图中各回离散的原因是什么?
正视图中各回离散是客观存在的事实,但主观解释却可以因人而异。李文将前八十回分为三类,认为是写作风格各不相同,进而认定作者各不相同。但即使这里不提分类的客观标准问题,这样推论仍然是不严格的,而且它无法自圆其说。请问,既然左边与中间的均为曹雪芹所写,为什么它们却被分为二类呢?如果这点可用不同时期所写来解释,那么同为第五次增删时“添入”的第七十八回和第七十九回,为什么又被归入不同的两类呢?这些问题的无法解释,反证了李文未能触及各回离散的本质原因。
这里打算借用几张表格来解释各回离散的原因。为了便于读者清晰地辨明,现将左边的八回称为第I类,它共有8,033句[5],有52,371字;中间的二十七回为第Ⅱ类,共24,052句,165,995字;右上角的四十四回为第Ⅲ类,共39,730句,269,342字。先观察文言虚字在各类每千字中出现的频率[6]:
从第I类到第Ⅲ类,文言虚字出现的频率明显地由高到低,但白话虚字的情形却正好相反。显然,各回中文言、白话虚字比例不均衡,乃是各回离散的根本原因。这也容易理解,因为那张正视图本来就是根据它们出现的频率计算出来的。
笔者之所以能迅速意识到这一点,是因为统计数据时曾为此问题颇费思索。《红楼梦》的语言属近代白话,它虽与现代白话相近,但绝不是相同。差异就在于白话中含有文言的痕迹,有时少些,有时多些,有时干脆有整段甚至大段的文言插入。鉴于这种情况,第一次统计时便将整段文言排除在外,但很快又感到这样做不尽合理。有些人物讲话时会夹入些文言,有时只有一句两句,是否应该将这些也排除在外呢?如果排除在外,整部《红楼梦》就被弄得支离破碎了,而且经常遇到的那些半文不白的话也难以归类。最后,考虑到本人采用的是将120回分为三组检验分布的方法,各组均有二十多万字,其中个别值偏高或偏低并不影响总体检验,于是最终采取了对全书进行统计的方式。当时根据李贤平同志的愿望,将数据与拙作《从数理语言学看后四十回作者》[7]交给他时,说明了这一考虑过程,那篇当时还不知能否发表的文章中也论及于此。但关于近代白话特色的说明遭到李贤平同志的忽略却是始料不及的,等知道有“成书新说”并发现其立论基础的种种破绽与错误,则均为李文发表以后的事了,在这之前自然没有而且也不可能发表什么意见。这实在是很可惜的。