加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

卓越的大脑之奖惩思维

(2022-06-05 13:07:41)
分类: 卓越的大脑

卓越的大脑之奖惩思维

20220605

兵法和朝政中,都有一个词汇,叫做“赏罚分明”,其实,这在人类驯服动物的历史中,也是如此。家畜就是通过“赏罚分明”进行有效驯化的;如果给家畜赏罚不明,家畜无法分辨究竟怎样才是好,可得利,怎样才算是不好,要挨打,这种家畜是无法听人指挥的,对人来说,就是无用的。

“赏罚分明”指的就是正确清晰的“奖惩机制”。“机制”,在现代科技体系中,就是原理,由各学科的基础原理综合搭配形成,包括文理科的数理化生和各类社会基础原理等等。中国古人对“赏罚分明”很是了解,而现代人们,却因为读书,忽略了与之所对应的“奖惩机制”。事实上,“奖惩机制”就是实现“赏罚分明”目标的运行过程和模式,一句话,就是“赏罚分明是怎样实现的”。

在近现代人类科技史中,参与到人类科学实验中的动物畜生数不胜数,人类也是通过“奖惩机制”,有效地驯服动物和畜生为人类服务。能够使用正确的、有效的“奖惩机制”实现“赏罚分明”,并因此驯服它们按照人类预定的实验目标行动,在近现代科技史上,起到了非常重要的作用。比如,在美国火箭中飞上天的大猩猩,也是严格经过“奖惩机制”训练后执行人类给予的任务的。

在这里,为了更好地利用“奖惩机制获得“赏罚分明”的效果,我认为,人人应该在上大学前,在十几岁的时候,都拥有“奖惩思维”。

在中学,尤其是高中的时候,全球风靡《学习的革命》这本书,我是从班主任马老师那里借阅的。高中时期,我一般只买1-2本的学科参考书,其它小说是语文老师傅老师那里借阅的,读得也不多,因为我一直认为小说是假的,小说用来学习文学知识差不多,但是,虚构的故事是不能模仿的,因此,我从小说里面读来的,基本都是警戒,不能做什么,而不是要做跟小说里面的人物角色做的事情。

我在读《学习的革命》的高中年代,我们的数理化老师,语文英语老师,都会帮我们分析各种卷子,卷子里有各种题型的题目,在分析的时候,老师们,都会自然而然地穿插进各类正反思维,正思维是对的,反思维是注定会错误的。正反思维与逆反向思维不一样,正反思维指的是答题的对错,而逆反向思维是全面思维的一种,是一对矛盾体,掌握和使用好逆反向思维,就是正思维,忘记了和忽视了逆反向思维,就容易导致反思维,答题错误。不是吗?正确的另一个方向,就是错误,也叫正确的反方向。

在此,先不说思维中的逆反思维,全面思维,定向思维,创新思维,综合思维,等等,我们在此文中,先讨论“奖惩思维”。

“奖惩思维”的形成,是一种要形成的习惯性思维,如果人类掌握和形成成为习惯,就有了控制和利用动物畜生的能力,如果连语言不通的动物都能听你的话,那么,你对与人相处,也是可以轻易掌握的。因此,“奖惩思维”,是一种社会性思维,对人际交往非常有帮助,也是领导思维中的一种,可以直接提升一个人的“领导力”。

最近在一本台湾作者写的中国传统24节气中看到“趋利避害”这个词,这是中国人利用24节气的一个目的和原则,“趋利避害”其实就是奖励“利处”,避开“害处”,是“奖惩思维”中,人类的基本需求之一。我在清华大学做集团采购的时候,也是按照公共原则,工作中“奖惩分明”,绝对不做“断别人财路”的损人不利己的事情。后来虽然在实验室管理期间,也做采购工作,但没有清华大学时期拥有更大的决定权,和更大的知名度(如果生意做到清华大学,对公司来说,是一种市场战略,可以提升公司及其产品的水平和质量)。我不做“断别人财路”的工作,也因为清华大学及其相应的供应商,都是全国最优秀的,供应商的老板和销售的质量,也是最高的,这是我尊敬他们的原因,毕竟,我也只是一名领导们的助理,实干者而已。在那里,我知道了,只要有心,就能做到自己想做的事情,比如“赏罚分明”,采用的就是最有效的“奖惩机制”。还有,很多名校毕业生也是清华大学的销售人员,而且,有一些还是是领导们的朋友,他们会通过朋友介绍到我这里来,我认为清华大学的领导们都是人杰,他们的朋友们也是,因此,在我这里,销售人员和公司都有机会,他们的“财路”没有因为我个人的喜好和跟领导们的关系亲疏而断。实际上,就是领导们个个都得罪不起,我不做“损人不利己”的事情。我唯一要做的,是不给工作单位带去劣质的产品和服务,因此,我对“罚”极度重视的,我对不合格公司的“惩罚”也很简单,不满足质量和服务,就要交“罚金”和被踢出局。索要“罚金”是领导主导的事情,不多,1-2次而已;我在的时候,只有一家潜在的代理公司因为售价过高和企图贿赂,被我弃用(我可以给教授们推荐好的公司,弃用就是不会给清华大学的教授们推荐,当然也代表我跟这家公司没有任何联系);一家在大会上承诺交纳小额广告赞助的代理公司出尔反尔不再交纳,因其信誉被我警告;一家因为是国企店大打算用ipad贿赂各个实验室的管家和教授,霸占通道,被其他三家公司销售集体投诉到我这里,我为了保证公平竞争,勒令这家公司停止这样的做法。基本上,没有出过其它问题。感恩当时所有支持和配合我工作的我的领导们和供应商公司及其销售们。销售们在售前跟我沟通,实际上他们背后的公司及其老板,也是给予了充分的支持。他们愿意参与公平竞争,也是我能顺利工作的基础。所有这些,在以年计数的工作环境中,优秀的“奖惩制度带来的“赏罚分明”,“趋利避害”,是必不可少的,都是人与人之间领导、交际、办事的原则、习惯,都能实现自己想要达到的目标——便利地控制和管理好自己环境中的人们更好地为己服务。我的目标是在工作中让教授们满意,而且真的通过“奖惩思维”达到了这样的目标。而且,最重要的是,态度决定一切,目标有了,实现目标的坚决的态度,是实现目标的第一步,否则,对待目标马马虎虎,对待实现目标的工作马马虎虎,目标是不会达到的。

“奖惩思维”不仅可以应用在控制其他人身上,也可以应用在自己身上,让自己养成好习惯,摈弃坏习惯。

“奖惩机制”适用于所有生物,跟达尔文的“适者生存,不适者淘汰”类似。生物在适合的环境中优越地存活,被大自然所奖励,在不适合的环境中不停地被惩罚,被大自然所抛弃。这是自然环境对生物的“奖惩机制”,也是一种规律性的“筛选机制”。这也属于人类的“奖惩思维”中的一部分,在形成习惯的时候需要被考虑到,不要思维定势住。

从数学上,“奖惩思维”还可以这么理解。“奖励”,可以增加生物的一种行为的重复性,而“惩罚”,则可以减少这种生物的行为的重复。人们往往在“被奖励”的时候开心、愉快,希望下一次也是如此;而人们还往往在“被惩罚”的时候不开心,不愉快,伤心,痛苦等,特别希望下一次不要在自己身上重复发生这种惩罚性事件。这样,人们就可以通过数学来研究人们需要多少次的“奖励”和“惩罚”,养成“奖励”训练模式下的好习惯,和“惩罚”训练模式下的坏习惯。而且,在这里,我们可以发现,养成好习惯和去除坏习惯其实是一回事,养成好习惯就是“有了好习惯,没有坏习惯”,而去除坏习惯也是“有了好习惯,没有坏习惯”,因此,“奖惩”都可以达到“有了好习惯,没有坏习惯”的目标,关键是,主体究竟是适合“奖励”训练还是适合“惩罚”训练。比如,奖励养成擦桌子的习惯,和惩罚不擦桌子的习惯,最终达到的目标,就是“擦桌子”习惯,训练过程,则是“奖惩思维”中的“奖励”和“惩罚”都可以。说到这里,我个人认为,对于主体来说,如果不是“奖励”效果太渺茫,就要选用“奖励”机制。“惩罚”,是一种执行起来,训练人员和被训练主体都很痛苦的行为模式。数学的引入,对于“奖惩思维”的训练应用,是非常有帮助的。“奖励”训练的阈值可以训练为0;而“惩罚”训练的阈值可以是“奖励”训练在长期以往的基础之上,继续为接近0的这种条件。

“奖惩思维”还需要继续研究,每一个行业自己都会有自己的“奖惩思维”,本文不会全部涉及,但基本上,今天能考虑到的,就是这些。(完)

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有