http://blog.sina.com.cn/wilddonkey[订阅]
字体大小: 正文
IQ解密(2008-04-24 08:43:26)

IQ解密(翻译)

作者:James R. Flynn

 

       整个20世纪见证了“弗林效应”——智商水平在每代人之间大幅度增加。现在,由弗林来为我们解释何以如此。

 

       1984年11月的一个星期六,天气阴霾,我在信箱里发现了一封令人震惊的邮件。我收到了一位荷兰知名学者发来的数据,并立刻知晓仅通过一代人,荷兰男性的IQ值就有了巨大的增长。到今天,类似的情形已经在近30个国家上演过——我们掌握了其中每个国家的数据。IQ的增长可能不会一直持续下去,但此趋势已统治了整个20世纪,而这足以制造出一场自信危机。今天的孩子比他们的父母聪明得多,或至少在某些情况下是这样,不过用以确认这点的衡量智力水平的IQ测试并不是一个好方法,矛盾层出不穷。直到现在我们才解决了这些矛盾——真正阐明了智力的根本性质,并弄清楚了我们与我们先辈之间的智力鸿沟所在。

智力和原子

       理解智力就像理解原子:我们不仅需要知道是什么将其各组成部分结合在了一起,还需要知道是什么将它们各自分开。将智力各组成部分绑定在一起的是通用智力因素g;而扮演原子粉碎机角色的是随时间变化的认知趋向。能同时涵盖这两方面的,最好的IQ测试是从1947年起一直沿用至今的韦氏儿童智力量表(WISC)。

       韦氏量表的10个子测验分别测度了不同的认知技能。相似性子测验测度的是一个人察觉事物之间拥有共同部分的能力;词汇子测验:是否你已积累了要用于每天生活的词语;信息子测验:常用信息的储备情况;算术子测验:解决数学问题的能力。在某个子测验上得分高于平均值的人,往往在所有子测验上都会优于他人,因此我们认为存在一个通用智力因素。一个称为因素分析的数学方法被用来计算各认知任务彼此间相互关联的程度,量化的计算结果就是所谓的g。

       一个测验中出类拔萃的人在某些认知任务上的成绩,要比在其他任务上更明显地优于普通人。这些任务往往都具有更高的认知复杂度,这强有力地证明了g能够用来衡量通用智力,还意味着可以根据g的负载量来对韦氏量表的子测验进行分级,即将这些子测验依照高IQ者胜过普通人的程度从高到低进行分级。

       不同的任务拥有不同的g负载量没什么好奇怪的,毫无神秘之处。擅长音乐者往往在钢琴,而不是击鼓上更优于普通人。一位有才华的厨师更可能在技巧性更强的任务如搅制蛋奶酥,而不是简单如炒鸡蛋上胜过普通人。前者要比后者复杂的多,因此更利于测试出卓越的烹饪能力。

发展趋势

       如果通用智力是在一直增长的,我们很自然会认为在每个子测验上的提高幅度应与它们的g负载量成正比。但当面对IQ增长结果的时候,我们发现了令人惊讶的情况:子测验的提高幅度与其g负载量之间存在着不一致。相似性和信息子测验拥有同样多的g负载量,然而前者的增长幅度却是后者的12倍。想想那个烹饪的例子,如果烹饪技能一直在提高,而g负载量的因素却可以被忽略不计就很奇怪了——比如在炒鸡蛋上有了显著的进展,但在搅制蛋奶酥上却止步不前。

       最近的IQ增长呈现出一种混乱的模式:相似性子测验为24分,而词汇、算术和信息子测验55年来仅有3分进账(见表)。韦氏量表不仅给出了子测验的分数,还对智力水平进行整体上的评估,被称为IQ整体测度。其增长是巨大的,总计有18分之多。要求学生根据前面的一组图片找出下一张图片的瑞文推理测验,同样是分析IQ发展趋势的重要测试,由于美国的数据不足,我基于其他国家的数据给出了一个每十年增长5分的保守估计。相比于我们,为何离我们最近的先辈是如此的缺少智力?英国的数据表明,相较于1900年代,智力的增长是全方位的。

---------------------------------------------------------------------------------------------

IQ长程增长曲线

       增长曲线为测得的IQ分数(按惯例,设置标准差为15)。从1947到2002年间,韦氏儿童智力量表的结果更新了三次,得出了三个时期的增长估值。瑞文推理测验结果中缺少可靠的关于美国的数据,我保守地给出了每年0.5分的IQ增长率。(该增长率是我们所掌握的所有发达国家中的最低值)

------------------------------------------------------------------------------------------

       我已经解释了与IQ激增有关的基本概念,现在可以推出由其导致的4个矛盾了。其中三个IQ增长的模式和幅度有关,第四个还包括我们自认为的对基因和环境的了解。

矛盾1:因素分析矛盾:

       韦氏量表子测验的能力增长模式与其g负载量关系甚微,智力怎么可能既是一元的(如因素分析中所体现的),又是多元的(每子测验有其各自的增长趋势)?此矛盾的关键之处在于因素分析所采用的是静态设定,个体与社会间的关系保持恒定。而IQ发展趋势是在动态环境中形成的,社会改变着文化偏好,其中就包括综合性技能成为了最被看重的能力。

       例如在某时,因素分析会显示短跑和跳高拥有近似的高g负载量,这意味着拥有充满弹性双腿的人在这两方面都会做的很好。然而时过境迁,年轻人或许会发现短跑富有魅力,而跳高枯燥乏味,由此人们在前者上的能力会逐步增强,于后者则保持不变。两者的相关性掩盖了它们所需的技能间没有功能上的共性这一事实。以最快速度冲向终点线的能力,没有最大程度地提高你的跳高能力,因为你不会花时间去跳高。前者随时间的进展与后者的停步不前完美共存。

       为了解释IQ的发展模式,我们需要从功能上分析是什么随时间提高了不同方面的认知技能。科学的发展在两方面造成了巨大的变化:其教导我们与对这个世界进行掌控相比,用科学的分类方式对世界进行分类同样地重要;其使逻辑摆脱了具体,使我们得以运用抽象而不涉及具体所指。在20世纪早期,一个典型三段论会是这样:“矮脚长耳猎犬擅长猎兔。那是一条矮脚长耳猎犬。因此,我会在狩猎的时候用上那条狗。”而今天我们更可能这样来说:“只有哺乳动物会哺育幼仔。兔子和狗都哺育幼仔。因此它们都是哺乳动物。”

       如果问狗和兔子的共同点是什么,一个1900年的男孩会这样回答,“你可以用狗来猎捕兔子。”而一个2007年的男孩会说,“它们都是哺乳动物。”一个世纪前的人绝不会给出这样毫无价值的答案,谁会去关心狗和兔子都是哺乳动物?重要的是什么是有用的并且能为人所控。

       之所以韦氏量表相似性子测验的得分会在过去整整一世纪中取得惊人的增长,正是因为其为狩猎,或者说功利性答案给出的是0分,而为哺乳动物,或者说分类答案给出的是满分。词汇和信息这样的子测验就大不相同了,它们从日常生活所需的词汇和信息中抽取出核心的部分,从具体到抽象的转变对它们没有多大影响。

       另有一个IQ测试与相似性子测验的增长幅度相仿,那就是瑞文推理测验。这些增长不再有任何神秘之处,要想得到高分,你必须发现抽象图案的第二特征,以应用逻辑来对其进行处理。也就是说,你必须觉察出一组图形中所包含的逻辑顺序,而这正是更为视觉化的现代文化所鼓励的。

----------------------------------------------------------------------------------------------

IQ测试举例

----------------------------------------------------------------------------------------------

       我们会很容易误解相似性子测验和瑞文推理测验之间的关系,涵盖各种智力测验的因素分析结果显示,这两者比其他任何一对测验在得分情况上都要更有共同点,而现在它们又展现了同样幅度的巨大增长势头。然而这两个测试就像短跑和跳高一样,几乎没有任何功能上的共同点。它们之间具有相关性并且增长趋势类似的原因在于,当一个人以科学的眼光来打量世界时,他或她会得到两点好处:其一是逻辑能够从具体中解放出来,得以对抽象进行分析,这提高了瑞文推理测验的得分。另一个是观察世界的角度从仅为实用到分类方式的转变,这提高了相似性子测验的得分。同一个人很可能得益于这两点的程度是相同的,但这两个测验所涉及的认知任务确是相当的不同。

       因素分析结果还显示,算术子测验和瑞文推理测验都在同一个因素上拥有高g负载量。该事实会带来这一观点:数学式思考和瑞文推理测验使用的认知问题在功能上具有相关性。毕竟,瑞文推理测验要求你能够看出所显示图形间的逻辑关联(之前没有学习过相关方法),而数学所要求的是运用非语言工具来掌握新的证明。因此可以估计到用瑞文推理测验式的问题训练孩子,会另他们更善于解决数学问题,许多美国学校从1991年起已经开始这样做了。

       然而瑞文推理测验得分的大幅度增长,与算术子测验实际上的零增长表明两者间不会有很强的功能相关性。对一个非数学家来说,数学并不比存在一个不用服从自然规律的独立实体这件事更合乎逻辑。如同婴儿对自然界的探索一般,孩子们必须通过自我发现的方式来对数学世界进行探索,并逐渐熟悉其中的种种“事物”,瑞文推理测验类型的任务对此没有什么贡献。

       我们的第一个矛盾解决了。在任一特定时刻,因素分析都能抽取出一个牢靠的g因素,智力由此表现为一元的,大多数的认知技能彼此间高度互相关。而随时间流逝,社会现实揭示出认知技能正游离于g因素,智力开始呈现出多元化。如果你想看到g,必须停止播放电影,立取此刻之像,在电影一直播放时你是看不到它的。社会是不做因素分析的,其是一切的主宰,偏废g负载量,强加以自身偏好。

矛盾2:智力矛盾

       IQ整体测度和瑞文推理测验得分的增长趋势表明,我们的父母大约比我们笨9到15分,而我们的孩子要比我们聪明9到15分。这些代间鸿沟理应在会话和日常生活中彰显出来,否则我们就要提出这样一个疑问:是否IQ得分的增长就是智力的增长?

       但这根本就是一个错误的问题,其暗示了认知能力的进步是全或无式的,而整个20世纪见证了特殊化倾向对大众化倾向的冲击。再来看看IQ增长曲线表,韦氏量表中与学校教学科目最相关的那些子测验增长幅度最小,将它们的发展趋势与美国国家教育进展评估测试(通常被称为全国成绩报告)的结果一相比较,事情就很清楚了。

       从1971年到2002年,四年级和八年级学生在阅读能力上的提高程度约等同于4个IQ得分,而十二年级学生几乎没有提高。如果我们聚焦于1972到2002年间韦氏测验结果的发展趋势,我们会看到学童的日常信息存储能力没有取得进步,词汇能力进步微小。因此,虽然今天的孩子也许能够在更小的年纪就读懂青少年文学作品,但对要求更高的成人文学,他们还没准备好。面对《战争与和平》,如果不得不在词典和百科全书中读完每个段落的话,你是无法欣赏到什么的。

       从1973年到2000年,四年级和八年级学生在数学能力上的提高程度约等同于11个IQ得分,12年级学生这次仍毫无进展。越来越多的孩子在更小的年纪就熟练掌握了计算技能。但韦氏算术子测验所测度的不仅包括计算技能,还涉及到了其它一些东西。例如,有这样一个问题:“4个玩具6美元,7个玩具多少钱?”许多能够直接做笔算的孩子无法判断出题目所需的两种运算:即必须先做除法,后做乘法。有些孩子则无法做包括分数的心算。

       对此,我的假说是孩子们在更小的年纪就掌握了计算技能,但在数学推理技能的学习上却没有取得进步,而推理技能对高级数学是必要的。因此,是12年级学生在提高数学问题解决策略上的失败导致了该结果。

       我们现在知道了为什么今天的孩子不会在交谈中令他们的祖父母蒙羞。假设我们听到一个刚刚毕业的高中生,正在与他的祖父(也完成了高中学业)谈论一星期前两人都读过的一本小说,我们没有理由认为他们中的任何一个必须要容忍另一个的迟钝。同样,如果对两人在高中毕业时所写的文章进行比较的话,我们也没有理由认为他们中的一个在把握词汇或应用日常信息上不如另一个。

矛盾3:智力迟钝矛盾

       第三个矛盾与离我们更为遥远的先辈有关——1900年的美国人。如果将今天美国人的平均智商设定为100,那么1900年美国人的平均智商将是50到70,这似乎表明那时的人正承受着智力迟钝所带来的痛苦。我们现在知道了为什么不必做如此担心,我们的先辈一点都不笨,他们只是把智力都应用在每天的现实生活上了,而真正的智力迟钝者是无法应付日常起居的。

       根据文兰适应行为量表(VABS)的测试结果,在IQ快速增长的同一时期,处理日常问题的能力保持恒定。今天的孩子(7岁到18岁)与1984年的孩子相比,在交流和社会子测验上的成绩没有提高,在日常生活技能子测验上反而有所不如。(该子测验中包括了一些过时的项目,比如“缝纫或给衣服镶边”。)

       自1900年以后我们没有变得更富有智力这一事实,并不意味着IQ值在此期间的大幅度增长是毫无意义的。我们可以应用抽象、逻辑和猜想,来对随科学将思想从具体情境中解放出来而涌现的各式问题进行处理。自1950年以来,我们愈发富有创造力,这使我们能够超越先前所习的规则,创造性地解决问题。(见下表)

----------------------------------------------------------------------------------------------
IQ增长与现实世界

       职业工作者带动了创新能力的增长。除非是工作所必需,否则没人会去主动创新。因为社会需要越来越多的人来从事管理、技术等职业工作,因此抛弃循规蹈矩,对创造性思考能力(瑞文推理测验的测试内容,见前表)进行提高具有了社会意义。

       第一胎新生儿的情况更有分析价值。家庭规模的缩小提高了这几年第一胎在新生儿中的百分比,于是认知能力的增强成为做个好父母的先决条件,父母必须认真对待孩子所能想到的各种问题,也就是说,他们必须坦然面对永无休止的“为什么”。

       电视游戏和电子游戏提高了含有视觉和符号要素问题的解决能力,游戏中的认知要求举例如下:俄罗斯方块——空间几何;神秘岛——工程解谜;侠盗猎车——计划。要想能够充分享受到闲暇活动所带来的乐趣,更强的问题解决能力是必须的。国际象棋大师越来越年轻,锦标赛的参赛标准持续攀高。

       上一代人的电视节目如《我爱露茜》、《法网》、《警界双雄》看起来实际上不需要集中太多的注意力,而从1981年的《希尔街的布鲁斯》开始,一集集的剧情将多达10个线索集合到情节主线中。热播剧《24小时》更是将20个或更多角色的生活串联在一起,每一个都有其独立的故事。

----------------------------------------------------------------------------------------------

矛盾4:基因和环境矛盾

       一对双胞胎一出生就被分开,各自成年后,他们智商水平的相似度要高于随机选取的两个人。对此,显而易见的解释是他们拥有同样的基因,这些研究结果被作为证据用来说明基因是决定性的,而环境的作用微不足道。而两代人之间存在着显著的智商差别这一点,似乎又表明环境因素影响巨大。因此我们的第四个矛盾就是,为什么有可靠的证据显示环境因素同时既是可以忽略不计的(血缘关系研究),又是强而有力的(IQ增长趋势)?

       设想有一对双胞胎约翰和乔,他们在刚出生时就被分开了,但都生活在一个痴迷篮球的地方,一样的基因使他们都要比同龄人更高、更快。约翰在一个城市上学,比其他人更热衷于打篮球,练的更多,球技也更好,引起了学校年级教练的注意,于是得以进入球队,到高中后继续发展,在那里得到了职业化的训练。乔在几百英里外的另一个城市上学,由于其基因与约翰是一样的,也比同龄人更高、更快,因此他很可能有着与约翰近似的生活轨迹。

       换句话说,随着他们所处的环境越来越有利,刚出生时不明显的基因优势决定了他们最终的篮球水平。基因因环境而显示出其决定性,这里的环境因素就是更多的练习、团队比赛、职业化训练。

       现在设想一个孩子的天资要比另一个高一些,他们中的哪一个会喜欢学校,受到赞扬,开始流连于图书馆,升至最高年级,进入大学?如果这个孩子有一个未曾谋面,经历相同的双胞胎兄弟的话,如何解释他们在成年后智商水平是近似的?相同的基因不是独自地,而是能够共同选择到相似环境的能力是个未解之谜。

       基因引发了能力和环境间强反馈回路的形成。一种基因带来的能力优势会导致能激发该能力环境的出现;此环境随之扩大了这种学习能力上的优势,得以进入高年级的能力进一步将环境升级;能力优势再次被扩大,而这有利于环境的又一次提升——一个好大学。这些反馈回路是如此影响着一个人的命运,我和我的合作者布鲁金斯学会的威廉·狄更斯将它们称为“个体乘法器”。

       同样还存在“社会乘法器”。为满足19世纪末20世纪初的工业革命需要,社会教育程度在不断提高。当中学教育得到普及时,每个中学毕业者都渴望获得高中文凭;当高中文凭已成为标准要求时,每个人都开始追求学士学位。经济发展缔造了一个中产阶级,他们希望自己能聪明地应付孩子,胜任工资更高的工作,享受有着更高认知技能要求的闲暇活动,没人愿意被看成是不称职的父母、不适合晋升、是个无趣的同事。每个人通过提高他们的能力来对新的环境做出应对,这将社会平均水平推向更高;他们继续对新环境做出应对,继续将平均水平推向更高。如此反复的结果就是:认知能力在一代人之间惊人地持续上升。

       在一代人中间,遗传差异驱动着反馈过程;在隔代人之间,环境发展趋势驱动着反馈过程。谁的作用更明显,谁就更有效。

隐藏的趋势及将来

       IQ的增长没能使人们摆脱盲信。抽象的分类和分析更利于被用来抵御谬论而不是感觉,看看相信神创论、飞碟和占星术的人数有多少就清楚了。

       而最近的历史见证了第二种趋势,受过教育的民众其语言已被极大丰富,这些用语非常能够提高关键性的才智。它们每一个都代表了一组概念,这些概念构成了一种应用于社会和道德问题的分析方法。特举例如下:市场(1776年开始流行)、百分比(1860)、自然选择(1864)、对照组(1875)、随机样本(1877)、自然主义谬论(1903)、超凡魅力效应(1922)、安慰剂(1938)、阳离子(1959)。

       感谢大学的专业化分科制度,没有哪个大学毕业生能够用得上这些词汇中的一小部分,IQ增长的全部潜力还有待挖掘。在过去的百年间,大学将学生教育的越来越好,因此在21世纪,人的能力会进一步提高是确定无疑的。

 

 

  • 评论加载中,请稍候...
发评论    明星私家相册

验证码:看不清楚数字吗?点击这里再试试。收听验证码

发评论

以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

相关博文
读取中...
推荐博文
读取中...